Oracle AI Vector Search Deep Dive
دوره Oracle AI Vector Search Deep Dive یک دوره پیشرفته و تخصصی در حوزه ترکیب پایگاه داده اوراکل با فناوریهای هوش مصنوعی و جستجوی برداری است. این دوره با معرفی مفهوم Vector Indexes آغاز میشود و شما را با روشهای نوین ایندکسگذاری مانند HNSW و IVF آشنا میکند. همچنین نحوه تنظیم پارامترها، پایش دقت جستجو و بهکارگیری بهترین روشها برای بهینهسازی عملکرد در سناریوهای واقعی آموزش داده میشود.
در ادامه، یکی از مهمترین کاربردهای این فناوری یعنی Retrieval Augmented Generation (RAG) بررسی میشود. در این بخش، یاد میگیرید چگونه دادههای برداری را با مدلهای زبانی بزرگ (LLM) ترکیب کرده و یک خط لوله کامل برای تولید پاسخهای هوشمند و دقیق ایجاد کنید.
بخش دیگری از دوره به Embedding Models اختصاص دارد؛ جایی که با استفاده از توابعی مانند VECTOR_EMBEDDING، دادهها را به بردار تبدیل کرده و عملیات Similarity Search را روی آنها انجام میدهید. همچنین نحوه کار با سرویسهای هوش مصنوعی Oracle Cloud (OCI) از طریق Python و PL/SQL برای ساخت سیستمهای هوشمند آموزش داده میشود.
در ادامه، مراحل آمادهسازی و پردازش دادهها شامل بارگذاری دادهها، خرد کردن متن (Text Chunking)، استخراج اطلاعات و طراحی Promptهای مناسب برای استفاده در سیستمهای AI بررسی میشود. این بخش نقش کلیدی در کیفیت خروجی سیستمهای مبتنی بر RAG دارد.
در نهایت، با زیرساختها و ابزارهای پشتیبان مانند Exadata AI Storage، استفاده از GoldenGate برای تکثیر دادههای برداری، ایجاد سیستمهای بلادرنگ (Real-time Vector Hub) و ابزارهای مدیریت داده مانند SQL Loader و Data Pump آشنا خواهید شد.
این دوره مناسب متخصصان دیتابیس، توسعهدهندگان و علاقهمندان به حوزه AI است که میخواهند از قابلیتهای پیشرفته Oracle AI Database برای ساخت سیستمهای هوشمند، جستجوی معنایی و اپلیکیشنهای مبتنی بر هوش مصنوعی استفاده کنند.
سر فصل های دوره
1 Vector Indexes (اینْدِکسهای برداری)
ضرورت استفاده از ایندکسهای برداری در پایگاه داده.
آشنایی با HNSW: ایندکس گراف همسایگی در حافظه.
آشنایی با IVF: ایندکس پارتیشنبندی همسایگی.
پارامترهای مهم در ایجاد ایندکس برداری و پایش دقت آن.
محدودیتها و بهترین روشها (Best Practices) در استفاده از ایندکسها.
2 Retrieval Augmented Generation – RAG (تولید محتوا با بازیابی افزوده)
مرور کلی مفهوم RAG و گردش کار دادههای برداری.
نحوه تعامل با مدلهای زبانی بزرگ (LLM) و تکمیل خط لوله RAG.
پیادهسازی RAG با استفاده از جستجوی برداری اوراکل.
3 Embedding Models (مدلهای جاسازی)
استفاده از تابع VECTOR_EMBEDDING برای تبدیل دادهها.
نحوه برداری کردن (Vectorize) یک جدول و انجام جستجوی شباهت (Similarity Search).
کار با سرویس هوش مصنوعی مولد OCI با استفاده از Python و PL/SQL.
4 Data Preparation & Processing (آمادهسازی و پردازش دادهها)
بارگذاری منابع داده و خرد کردن متن (Text Chunks).
استخراج متن و آمادهسازی برای تولید بردار.
ساخت پرسش (Prompt) و فراخوانی زنجیره پردازشی (Invoke the Chain).
5 Supporting Features & Infrastructure (ویژگیهای حمایتی و زیرساخت)
Exadata: AI Storage: بهینهسازی ذخیرهسازی برای دادههای هوش مصنوعی.
استفاده از GoldenGate برای تکثیر بردارها در سیستمهای توزیع شده.
ایجاد هاب برداری بلادرنگ برای هوش مصنوعی مولد (Real-time Vector Hub).
ابزارهای SQL Loader و Data Pump برای مدیریت دادههای برداری.