Mongo.local Seoul 에서 발표된 자료는 향후 Public하게 공개될 예정입니다.
Vector Search 란 머신 러닝을 활용하여 텍스트, 이미지 등 비정형 데이터의 의미와 컨텍스트를 숫자 표현으로 변환합니다. Vector Search 는 알고리즘을 통해 가장 유사한 데이터를 검색해 주는 기능입니다.
Atlas Vector Search Explained in 3 minutes
참석 계기 : MongoDB를 비롯한 NoSQL을 사용해보고 싶었는데 어떤 상황에 도입해볼 수 있을지 인사이트를 얻기 위해 참석하게 되었다.
발표 내용 : 정말로 그런지는(?) 아직 사용경험이 없어서 알 수 없지만 MongoDB는 RDS를 완전히 대체하거나 그 이상의 역할을 할 수 있다는 내용이 있었다. MongoDB 쪽 아키텍트들이나 AWS, GCP 아키텍트들이 발표한 내용으로는 크게 MongoDB Atlas로 마이그레이션을 쉽고 간단하게 할 수 있는 기능을 제공하고 있으며 이를 위한 기술적 지원도 잘 이루어져 있다는 것이었다. 전문 DBA가 없거나 기술적 지원 혹은 클라우드가 제공하는 다양한 서비스와의 연계를 계획하고 있다면 Atlas를 사용하는 것도 좋은 선택일 것 같았다. 또한 다국적 서비스를 제공하고 있거나 IoT 서비스를 제공하는 기업의 경우에는 수많은 데이터가 발생하기 때문에 Atlas로 전환했을 때 클러스터 운영이나 샤딩같은 수평적 확장에 유리하다는 사례를 발표했다. 또한 Vector Search 같은 기능을 통해 비즈니스 인사이트를 도출하는데도 도움을 줄 수 있다.
SQL 워크로드를 MongoDB 워크로드로 가장 빠르고 안정적으로 전환시켜 주는 도구
MongoDB를 왜 사용해야 하는가?
결국 Relational Migrator란 무엇인가?
삼성 Know 사용하는 MongoDB 환경
MongoDB
Installed on EC2 instance
Memory optimized type instance
Replica set (P/S/S)
Version : v4.4
(Enterprise Advanced)
Cluster : 15+
DB: 65+
Collections : 950+
Data size : 4TB+
Largest Collection : ~1TB, 51 indexes
Ops manager
Version : v5.0.21
Monitoring - Real Time, Trend
Alert
Backup
Maintenance
Index manage
Account manage
Index Creation
실제 인스턴스에 설치 된 MongoDB와 Replicaset을 이용할때
2개의 Index 생성 할 경우
Primary Node는 첫번째 인덱스가 수행이 되고 2번째 index 생성이 될때 Secondary Node 에서 첫번째 인덱스 생성이 진행 중이여서 인덱스 생성이 지연되는 문제가 발생 하여 Secondary Node가 읽기로 사용될 경우 Index가 적용되지 않는 문제가 발생함
Read tickets become to 0