akenji's lab

neo4jをインストールしてknowledge graphsを試す

August 31, 2024に投稿 | • 翻訳：en

モチベーション

これまで、FAISSやBM25を使ってRAGシステムを構築した。ベクトル検索は比較的簡単に構築できるが、必要な情報が"k"個の文書にない場合もあり、精度向上策を調べていた。たまたまこの記事を読んで、ナレッジグラフに興味を持って、自分でも試してみようと思った。

この投稿では、ナレッジグラフを使うため、nao4jをローカル環境にインストールし、ブラウザから使ってみるまでをまとめる。

[続きを読む]

RAGシステムを構築

August 15, 2024に投稿 | • 翻訳：en

はじめに

昨日までに、Wikipediaから天文関連の項目を抽出し、RAG向けにベクトルデータベースとキーワードベースを作成した。ここでは、それらのデータベースを使って、RAGシステムを構築する。

使用するLLMは、ChatGPT（gpt-4o）とLlama-3-ELYZA-JP-8Bを使う。

[続きを読む]

RAG向けデータベースを作成・評価

August 14, 2024に投稿 | • 翻訳：en

はじめに

昨日作成したテキストデータからRAGで使えるデータベースを作成し、数個の特定文字列を用意し、それを検索して評価する。

[続きを読む]

WikipediaダンプデータからRAG向けテキストデータ作成

August 13, 2024に投稿 | • 翻訳：en

モチベーション

LangChainを使ってRAGを試しているのだが、確認用に使用するデータに何を使おうかと考えていたところ、wikipediaのダンプデータを使うことにした。全体ではボリュームを大きいので、自分の興味のある天文関係のカテゴリーのデータを使うことにした。

ここでは、wikipediaダンプデータから特定のカテゴリーのデータのみを取り出す一連の手順をまとめた。

[続きを読む]

llama-cpp-python 〜 numpyバージョンアップの影響

July 4, 2024に投稿 | • 翻訳：en

はじめに

NumPy 2.0.0が6月16日にリリースされた。先日、lang-chainを使ってRAGを試してみようとして、dockerコンテナをビルドする際にエラーとなって初めて気付いた。その後、llama-cpp-pythonを組み込む際にCMakeでエラーが発生した。

[続きを読む]

LlamaIndexを使ってRAGを試す

May 25, 2024に投稿 | • 翻訳：en

モチベーション

Chatbot UIを試したこの投稿で、今後挑戦したいことの一つにRAG（Retrieval Augmented Generation）との連携と述べた。この投稿ではLlamaIndexを使ってRAGを実現する方法についてまとめた。

実は昨年末にLangchainを使ってRAGを試してみた。その後、LlamaIndexとのキーワードを良く聞いてきたので、今回LlamaIndexを使ってRAGを実現することにした。

[続きを読む]

Chatbot UIを試す

May 6, 2024に投稿 | • 翻訳：en

はじめに

先日の投稿では、llama-cpp-pythonを使ってローカル環境でELYZA 7Bモデルを動かした。その投稿で「今後について」ChatGPTのように会話できるシステムの構築に挑戦したいと述べた。

今回、ChatGPTのように会話できるシステムをdockerコンテナで構築したので、その内容をここにまとめる。

[続きを読む]

Elyzaモデルをllama-cpp-pythonを使ってGPUで動かす

May 3, 2024に投稿 | • 翻訳：en

モチベーション

LLMを手元のワークステーション（GPUのメモリ12〜16GB）で動かすには量子化が必須となる。この投稿では、llama-cpp-pythonを使って、GPU資源を最大限に活用することに挑戦したので、その内容をまとめる。

自分の理解不足のためハマったところもあるので、自分が失敗した箇所も含めた内容となっている。

[続きを読む]

姫野ベンチマークを使ってOpenMPIの性能を再々測定する

March 20, 2024に投稿 | • 翻訳：en

はじめに

OpenMPI実行ノードの順番を決めるhostfileを変更して、姫野ベンチマークでOpenMPIの性能を再測定したことを、この記事として投稿した。投稿後、改めて考えてみて、CPU、クロックの性能から自分が判断するのではなく、客観的な数値で判断することにした。

そこで今回、個々のワークステーション（ノード）の性能を測定し、その結果に従ってhostfileの順序を決め、再々測定することにした。

[続きを読む]

姫野ベンチマークを使ってOpenMPIの性能を再測定する

March 17, 2024に投稿 | • 翻訳：en

はじめに

1ヶ月前のこの投稿で、姫野ベンチマークによるOpenMPIの性能を測定した。その記事を見た先輩からhostfileの順番について改善点を指摘していただいた。この投稿では、hostfileを修正して再度性能測定した結果をまとめた。

[続きを読む]

概要

neo4jをインストールしてknowledge graphsを試す

モチベーション

RAGシステムを構築

はじめに

RAG向けデータベースを作成・評価

はじめに

WikipediaダンプデータからRAG向けテキストデータ作成

モチベーション

llama-cpp-python 〜 numpyバージョンアップの影響

はじめに

LlamaIndexを使ってRAGを試す

モチベーション

Chatbot UIを試す

はじめに

Elyzaモデルをllama-cpp-pythonを使ってGPUで動かす

モチベーション

姫野ベンチマークを使ってOpenMPIの性能を再々測定する

はじめに

姫野ベンチマークを使ってOpenMPIの性能を再測定する

はじめに