Oracle AI Vector Search Deep Dive

دوره Oracle AI Vector Search Deep Dive یک دوره پیشرفته و تخصصی در حوزه ترکیب پایگاه داده اوراکل با فناوری‌های هوش مصنوعی و جستجوی برداری است. این دوره با معرفی مفهوم Vector Indexes آغاز می‌شود و شما را با روش‌های نوین ایندکس‌گذاری مانند HNSW و IVF آشنا می‌کند. همچنین نحوه تنظیم پارامترها، پایش دقت جستجو و به‌کارگیری بهترین روش‌ها برای بهینه‌سازی عملکرد در سناریوهای واقعی آموزش داده می‌شود.

در ادامه، یکی از مهم‌ترین کاربردهای این فناوری یعنی Retrieval Augmented Generation (RAG) بررسی می‌شود. در این بخش، یاد می‌گیرید چگونه داده‌های برداری را با مدل‌های زبانی بزرگ (LLM) ترکیب کرده و یک خط لوله کامل برای تولید پاسخ‌های هوشمند و دقیق ایجاد کنید.

بخش دیگری از دوره به Embedding Models اختصاص دارد؛ جایی که با استفاده از توابعی مانند VECTOR_EMBEDDING، داده‌ها را به بردار تبدیل کرده و عملیات Similarity Search را روی آن‌ها انجام می‌دهید. همچنین نحوه کار با سرویس‌های هوش مصنوعی Oracle Cloud (OCI) از طریق Python و PL/SQL برای ساخت سیستم‌های هوشمند آموزش داده می‌شود.

در ادامه، مراحل آماده‌سازی و پردازش داده‌ها شامل بارگذاری داده‌ها، خرد کردن متن (Text Chunking)، استخراج اطلاعات و طراحی Promptهای مناسب برای استفاده در سیستم‌های AI بررسی می‌شود. این بخش نقش کلیدی در کیفیت خروجی سیستم‌های مبتنی بر RAG دارد.

در نهایت، با زیرساخت‌ها و ابزارهای پشتیبان مانند Exadata AI Storage، استفاده از GoldenGate برای تکثیر داده‌های برداری، ایجاد سیستم‌های بلادرنگ (Real-time Vector Hub) و ابزارهای مدیریت داده مانند SQL Loader و Data Pump آشنا خواهید شد.

این دوره مناسب متخصصان دیتابیس، توسعه‌دهندگان و علاقه‌مندان به حوزه AI است که می‌خواهند از قابلیت‌های پیشرفته Oracle AI Database برای ساخت سیستم‌های هوشمند، جستجوی معنایی و اپلیکیشن‌های مبتنی بر هوش مصنوعی استفاده کنند.

سر فصل های دوره

1 Vector Indexes (اینْدِکس‌های برداری)

ضرورت استفاده از ایندکس‌های برداری در پایگاه داده.
آشنایی با HNSW: ایندکس گراف همسایگی در حافظه.
آشنایی با IVF: ایندکس پارتیشن‌بندی همسایگی.
پارامترهای مهم در ایجاد ایندکس برداری و پایش دقت آن.
محدودیت‌ها و بهترین روش‌ها (Best Practices) در استفاده از ایندکس‌ها.

2 Retrieval Augmented Generation – RAG (تولید محتوا با بازیابی افزوده)

مرور کلی مفهوم RAG و گردش کار داده‌های برداری.
نحوه تعامل با مدل‌های زبانی بزرگ (LLM) و تکمیل خط لوله RAG.
پیاده‌سازی RAG با استفاده از جستجوی برداری اوراکل.

3 Embedding Models (مدل‌های جاسازی)

استفاده از تابع VECTOR_EMBEDDING برای تبدیل داده‌ها.
نحوه برداری کردن (Vectorize) یک جدول و انجام جستجوی شباهت (Similarity Search).
کار با سرویس هوش مصنوعی مولد OCI با استفاده از Python و PL/SQL.

4 Data Preparation & Processing (آماده‌سازی و پردازش داده‌ها)

بارگذاری منابع داده و خرد کردن متن (Text Chunks).
استخراج متن و آماده‌سازی برای تولید بردار.
ساخت پرسش (Prompt) و فراخوانی زنجیره پردازشی (Invoke the Chain).

5 Supporting Features & Infrastructure (ویژگی‌های حمایتی و زیرساخت)

Exadata: AI Storage: بهینه‌سازی ذخیره‌سازی برای داده‌های هوش مصنوعی.
استفاده از GoldenGate برای تکثیر بردارها در سیستم‌های توزیع شده.
ایجاد هاب برداری بلادرنگ برای هوش مصنوعی مولد (Real-time Vector Hub).
ابزارهای SQL Loader و Data Pump برای مدیریت داده‌های برداری.

Oracle AI Vector Search Deep Dive

سر فصل های دوره

نوشته های مرتبط