Chroma db 설치 방법 그리고 실행 예제

 



최근 RAG에 대한 관심이 늘어가는 가운데 백터 데이터베이스의 최강자 chroma db에 대해서 알아보고 설치 방법에 대해서도 알아보겠습니다.

자! chroma db 설치 방법 및 사용 예제에 대해 한번 발자취를 남겨 봅시다!



1) chroma db란?



CHROMA DB는 데이터베이스의 일종으로, 주로 벡터 데이터를 저장하고 검색하는 데 특화된 데이터베이스입니다. CHROMA DB는 특히 벡터 검색(Vector Search)과 유사성 검색(Similarity Search)에 강점을 가지고 있습니다. 이는 주로 머신러닝, 특히 자연어 처리(NLP)와 컴퓨터 비전 분야에서 유용합니다.


* 주요 특징
- 벡터 데이터 지원: CHROMA DB는 숫자 벡터 데이터를 효율적으로 저장하고, 빠르게 검색할 수 있도록 설계되었습니다.
- 유사성 검색: 저장된 벡터 데이터 중에서 특정 기준(예: 코사인 유사도)에 따라 가장 유사한 벡터들을 검색할 수 있습니다.
- 확장성: 대규모 데이터셋에서도 효율적인 검색을 제공하며, 고성능을 유지합니다.


2) chroma 설치




pip install chromadb


4) chroma db 간단한 샘플 예제



import chromadb
chroma_client = chromadb.Client()
collection = chroma_client.create_collection(name="my_collection")


class chroma_db:
    def get_samples():
        results = []
        try:

            print("get_sample_chroma")
            collection.add(
                documents=[
                    "This is a doc 1",
                    "This is a doc 2"
                ],
                ids=["id1", "id2"]
            )

            results = collection.query(
                # Chroma will embed this for you
                query_texts=["doc 1"],
                n_results=2  # how many results to return
            )

            print(results)

        except Exception as err:
            print(err)
        finally:
            result = ""
        return result




오늘은 대표적인 백터 db chroma db는 무엇인지 그리고 설치 방법과 간단한 구동 예제를 살펴 보았습니다. 다음에는 실 사용 예제를 통해 chroma db에 대해서 깊게 접근해보겠습니다.

오늘 남긴 발자취가 보시는 모든 분들의 바른 길라잡이가 되었으면 합니다. 언제나 궁금한점 있으면 덧글로 남겨주세요. 감사합니다. :) 

댓글