RAGシステムを構築
August 15, 2024に投稿
| Kenji Arai
• 翻訳:en
はじめに
昨日までに、Wikipediaから天文関連の項目を抽出し、RAG向けにベクトルデータベースとキーワードベースを作成した。ここでは、それらのデータベースを使って、RAGシステムを構築する。
使用するLLMは、ChatGPT(gpt-4o)とLlama-3-ELYZA-JP-8Bを使う。
[続きを読む]
RAG向けデータベースを作成・評価
August 14, 2024に投稿
| Kenji Arai
• 翻訳:en
はじめに
昨日作成したテキストデータからRAGで使えるデータベースを作成し、数個の特定文字列を用意し、それを検索して評価する。
[続きを読む]
WikipediaダンプデータからRAG向けテキストデータ作成
August 13, 2024に投稿
| Kenji Arai
• 翻訳:en
モチベーション
LangChainを使ってRAGを試しているのだが、確認用に使用するデータに何を使おうかと考えていたところ、wikipediaのダンプデータを使うことにした。全体ではボリュームを大きいので、自分の興味のある天文関係のカテゴリーのデータを使うことにした。
ここでは、wikipediaダンプデータから特定のカテゴリーのデータのみを取り出す一連の手順をまとめた。
[続きを読む]
llama-cpp-python 〜 numpyバージョンアップの影響
July 4, 2024に投稿
| Kenji Arai
• 翻訳:en
はじめに NumPy 2.0.0が6月16日にリリースされた。先日、lang-chainを使ってRAGを試してみようとして、dockerコンテナをビルド
[続きを読む]
LlamaIndexを使ってRAGを試す
May 25, 2024に投稿
| Kenji Arai
• 翻訳:en
モチベーション
Chatbot UIを試したこの投稿で、今後挑戦したいことの一つにRAG(Retrieval Augmented Generation)との連携と述べた。この投稿ではLlamaIndexを使ってRAGを実現する方法についてまとめた。
実は昨年末にLangchainを使ってRAGを試してみた。その後、LlamaIndexとのキーワードを良く聞いてきたので、今回LlamaIndexを使ってRAGを実現することにした。
[続きを読む]
Chatbot UIを試す
May 6, 2024に投稿
| Kenji Arai
• 翻訳:en
はじめに
先日の投稿では、llama-cpp-pythonを使ってローカル環境でELYZA 7Bモデルを動かした。その投稿で「今後について」ChatGPTのように会話できるシステムの構築に挑戦したいと述べた。
今回、ChatGPTのように会話できるシステムをdockerコンテナで構築したので、その内容をここにまとめる。
[続きを読む]
Elyzaモデルをllama-cpp-pythonを使ってGPUで動かす
May 3, 2024に投稿
| Kenji Arai
• 翻訳:en
モチベーション
LLMを手元のワークステーション(GPUのメモリ12〜16GB)で動かすには量子化が必須となる。この投稿では、llama-cpp-pythonを使って、GPU資源を最大限に活用することに挑戦したので、その内容をまとめる。
自分の理解不足のためハマったところもあるので、自分が失敗した箇所も含めた内容となっている。
[続きを読む]
姫野ベンチマークを使ってOpenMPIの性能を再々測定する
March 20, 2024に投稿
| Kenji Arai
• 翻訳:en
はじめに
OpenMPI実行ノードの順番を決めるhostfileを変更して、姫野ベンチマークでOpenMPIの性能を再測定したことを、この記事として投稿した。投稿後、改めて考えてみて、CPU、クロックの性能から自分が判断するのではなく、客観的な数値で判断することにした。
そこで今回、個々のワークステーション(ノード)の性能を測定し、その結果に従ってhostfileの順序を決め、再々測定することにした。
[続きを読む]
姫野ベンチマークを使ってOpenMPIの性能を再測定する
March 17, 2024に投稿
| Kenji Arai
• 翻訳:en
はじめに
1ヶ月前のこの投稿で、姫野ベンチマークによるOpenMPIの性能を測定した。その記事を見た先輩からhostfileの順番について改善点を指摘していただいた。この投稿では、hostfileを修正して再度性能測定した結果をまとめた。
[続きを読む]
Rayleigh-Taylor不安定性 〜 Athena++チュートリアル4追加課題
March 15, 2024に投稿
| Kenji Arai
• 翻訳:en
はじめに
この記事ではAthena++のチュートリアル4に取り組んだことを投稿した。ここでは、3次元におけるRayleigh-Taylor不安定性の課題に挑戦したので、その内容を投稿する。
[続きを読む]