GitHub - rnrifai-source/AI_testing

pip install -r requirements.txt

streamlit run main.py

Tujuan Utama Skrip

Skrip ini adalah chat interface AI berbasis dokumen PDF, dibangun menggunakan LangChain, Streamlit, dan Bedrock (AWS). Data chat disimpan di SQLite dan disinkronkan ke S3.

Komponen Utama & Penjelasannya

LangChain Modules

Digunakan untuk memproses dokumen dan membuat RAG (Retrieval-Augmented Generation).

BedrockEmbeddings: Membuat vektor embedding dari teks menggunakan Amazon Bedrock (model foundation).

FAISS: Library untuk menyimpan dan mencari vektor. Dipakai untuk pencarian semantik cepat.

Hasil dari proses ini biasanya disimpan dalam file .faiss dan .pkl:

.faiss: menyimpan index FAISS.

.pkl: menyimpan metadata (contohnya teks asli atau ID-nya).

PyPDFLoader: Untuk memuat konten dari PDF ke dalam format yang bisa diproses.

RecursiveCharacterTextSplitter: Memecah teks panjang menjadi potongan kecil yang lebih mudah diproses oleh LLM.

Streamlit

Biasanya digunakan untuk:

Upload PDF
Menampilkan chat
Menjalankan pertanyaan ke model

SQLite (chat_sessions dan chat_messages)

Dua tabel disiapkan untuk menyimpan riwayat percakapan:

chat_sessions: metadata setiap sesi chat.
chat_messages: isi dari setiap percakapan, dengan referensi ke sesi-nya.

AWS S3 Sync

Variabel BUCKET_NAME dan CHAT_DB_S3_KEY dipakai untuk:

download_file: mengambil financial_ai_chats.db dari S3.
upload_file: mengunggah hasil update kembali ke S3.

ChatManager Class

Menangani:

Sinkronisasi database dari/ke S3
Inisialisasi database SQLite
Mungkin juga mengatur insert/delete untuk chat (belum terlihat semua)

File Output & Fungsinya

File	Fungsi
`.faiss`	Index untuk pencarian vektor FAISS
`.pkl`	Metadata terkait dokumen / chunk / mapping
`financial_ai_chats.db`	Menyimpan data chat user secara lokal
(PDF files)	Diunggah oleh user untuk dijadikan dasar pertanyaan

Alur Umum Aplikasi

User upload PDF via Streamlit.

Teks di-split jadi chunk kecil → dibuat embedding dengan Bedrock.
Embeddings disimpan di FAISS index (.faiss + .pkl).
User bertanya → sistem cari chunk paling relevan → kirim ke LLM.
Jawaban & history disimpan di SQLite → di-sync ke S3.

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
.idea		.idea
.dockerignore		.dockerignore
.gitignore		.gitignore
01-namespace.yaml		01-namespace.yaml
02-configmap.yaml		02-configmap.yaml
04-deployment-minikube.yaml		04-deployment-minikube.yaml
04-deployment.yaml		04-deployment.yaml
05-service-minikube.yaml		05-service-minikube.yaml
05-service.yaml		05-service.yaml
06-ingress-minikube.yaml		06-ingress-minikube.yaml
06-ingress.yaml		06-ingress.yaml
07-hpa.yaml		07-hpa.yaml
07-pvc-minikube.yaml		07-pvc-minikube.yaml
DEPLOYMENT.md		DEPLOYMENT.md
Dockerfile		Dockerfile
Magnus_AI_Project.png		Magnus_AI_Project.png
README.md		README.md
deploy.sh		deploy.sh
docker-compose.yml		docker-compose.yml
financial_ai_chats.db		financial_ai_chats.db
main.py		main.py
quest.md		quest.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Tujuan Utama Skrip

Komponen Utama & Penjelasannya

LangChain Modules

Streamlit

SQLite (chat_sessions dan chat_messages)

AWS S3 Sync

ChatManager Class

File Output & Fungsinya

Alur Umum Aplikasi

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Tujuan Utama Skrip

Komponen Utama & Penjelasannya

LangChain Modules

Streamlit

SQLite (chat_sessions dan chat_messages)

AWS S3 Sync

ChatManager Class

File Output & Fungsinya

Alur Umum Aplikasi

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages