データサイエンス学習記録

ひよっこAIエンジニアの学習記録です。

社会人4年目の時にQC検定1級を取得した勉強法

はじめに 受験前の状況 受験のきっかけ QC検定1級概要 QC検定1級合格基準 QC検定1級合率 QC検定1級の勉強方法 使用した教材 勉強スケジュールと勉強時間 勉強方法 ①過去問を解いて理解する。 ②QC検定受検テキスト→演習問題を解く。 ③(論述以外の)過去問を…

【Claude3 vs GPT-4】表の抽出どっちが上手いか

はじめに 表の抽出 表のデータ 実験方法 1. 単純な表の場合 2. セル結合を含む表の場合 3. セル結合を複数含む表の場合 結論 はじめに ドキュメント内に表の情報が埋め込まれている場合が多く、自然言語処理において表を正しく抽出することは重要です。 今回…

AIエンジニアが揃えたリモートワークグッズ10選

u{ text-decoration: none; background: linear-gradient(transparent 50%, yellow 50%) !important;} はじめに リモートワークおすすめグッズ 1位. G 29インチ ウルトラワイドモニター 29WP500-B 2位. ロジクール ワイヤレスマウス LIFT M800 3位. ロジクー…

未経験からAIエンジニアになるために勉強したこと

はじめに 資格 統計検定 2級 ★★★★★ 統計検定 準1級 ★★★★☆ 統計検定 1級 ★☆☆☆☆ G検定 ★★★★☆ E資格 ★★★☆☆ プログラミング [講座]Tech Academy(Python+データサイエンス+AIコース) ★★★☆☆ [書籍]東京大学のデータサイエンティスト育成講座 ★★★★★ [書籍]Kaggle…

埋め込みモデルe5-mistral-7b-instructを使ってみた。

概要 埋め込みモデルe5-mistral-7b-instructを使って、テキスト間のコサイン類似度を計算する方法をまとめる。 ※内容が間違っている可能性があります、ご容赦ください。 e5-mistral-7b-instruct 今回使用する、埋め込みモデルです。 2024年2月17日現在、MTEB…

【LangChain】Ensemble Retrieverを使ってみた。

概要 LangChainのEnsemble Retrieverの使い方をまとめる。 今回はBM25、HuggingFace(sonoisa)、OpenAI(text-embedding-ada-002)の3つでEnsemble Retrieverを使ってみます。 Ensemble Retriever 検索精度を向上させるために、複数の検索結果を使用して順位を…

統計検定準1級で最優秀成績賞を一発取得した勉強方法

統計検定準1級で最優秀成績書を一発で取得したので勉強方法をまとめようと思います。これから受験される方の参考になれば幸いです。 受験前の私の状況 受験のきっかけ 統計検定準1級概要 統計検定準1級の勉強法 使用した教材 勉強スケジュールと勉強時間 勉…

【LangChain】Faissとコサイン類似度の計算

概要 ベクトルストア(Faiss)とコサイン類似度の計算をまとめる。 Faiss 「Faiss」は、Meta社が開発したライブラリで、文埋め込みのような高次元ベクトルを効率的にインデックス化し、クエリのベクトルに対して高速に検索することができる。 python.langchain…

E資格の勉強方法

E資格 2023#1に合格したので、私の勉強方法をまとめようと思います。 これから受験される方の参考になれば幸いです。 受験前の私の状況 E資格概要 受講した認定プログラム 講座の進め方 良かった点 苦労した点 AVILENをお勧めする人 E資格の勉強方法 使用し…