You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: localization/v2.5.x/site/ar/tutorials/use_ColPali_with_milvus.md
+3-3Lines changed: 3 additions & 3 deletions
Original file line number
Diff line number
Diff line change
@@ -1,7 +1,7 @@
1
1
---
2
2
id: use_ColPali_with_milvus.md
3
3
summary: >-
4
-
في هذا الدفتر، نشير إلى هذا النوع من التمثيل متعدد النواقل باسم "تضمينات
4
+
في هذا الدفتر، نشير إلى هذا النوع من التمثيل متعدد المتجهات باسم "تضمينات
5
5
ColBERT" من أجل التعميم. ومع ذلك، فإن النموذج الفعلي المستخدم هو نموذج
6
6
ColPali. سنوضح كيفية استخدام ميلفوس لاسترجاع متعدد المتجهات. بناءً على ذلك،
7
7
سنقدم كيفية استخدام ColPali لاسترجاع الصفحات بناءً على استعلام معين.
@@ -31,12 +31,12 @@ title: استخدام كولبالي للاسترجاع متعدد الوسائ
31
31
</button></h1><p>تستخدم نماذج الاسترجاع الحديثة عادةً تضمينًا واحدًا لتمثيل النص أو الصور. ومع ذلك، فإن ColBERT هو نموذج عصبي يستخدم قائمة من التضمينات لكل مثيل بيانات ويستخدم عملية "MaxSim" لحساب التشابه بين نصين. بالإضافة إلى البيانات النصية، تحتوي الأشكال والجداول والرسوم البيانية أيضًا على معلومات غنية، والتي غالبًا ما يتم تجاهلها في استرجاع المعلومات المستندة إلى النصوص.</p>
<p>تقارن دالة MaxSim استعلامًا مع مستند (ما تبحث فيه) من خلال النظر في تضمينات الرموز المميزة الخاصة بهما. لكل كلمة في الاستعلام، تقوم باختيار الكلمة الأكثر تشابهًا من المستند (باستخدام تشابه جيب التمام أو مسافة L2 المربعة) وتجمع أوجه التشابه القصوى هذه عبر جميع الكلمات في الاستعلام</p>
39
-
<p>ColPali هي طريقة تجمع بين تمثيل ColBERT متعدد المتجهات مع PaliGemma (نموذج لغوي كبير متعدد الوسائط) للاستفادة من قدرات الفهم القوية. يتيح هذا النهج تمثيل صفحة تحتوي على كل من النص والصور باستخدام تضمين موحد متعدد المتجهات. يمكن للتضمينات داخل هذا التمثيل متعدد النواقل أن تلتقط معلومات مفصلة، مما يحسّن أداء التوليد المعزز للاسترجاع (RAG) للبيانات متعددة الوسائط.</p>
39
+
<p>ColPali هي طريقة تجمع بين تمثيل ColBERT متعدد المتجهات مع PaliGemma (نموذج لغوي كبير متعدد الوسائط) للاستفادة من قدرات الفهم القوية. يتيح هذا النهج تمثيل صفحة تحتوي على نص وصور باستخدام تضمين موحد متعدد المتجهات. يمكن للتضمينات داخل هذا التمثيل متعدد المتجهات أن تلتقط معلومات مفصلة، مما يحسن أداء التوليد المعزز للاسترجاع (RAG) للبيانات متعددة الوسائط.</p>
40
40
<p>في هذا الدفتر، نشير في هذا الدفتر إلى هذا النوع من التمثيل متعدد النواقل باسم "تضمينات كولبيرت" من أجل العمومية. ومع ذلك، فإن النموذج الفعلي المستخدم هو <strong>نموذج ColPali</strong>. سنوضح كيفية استخدام ميلفوس لاسترجاع متعدد المتجهات. بناءً على ذلك، سنقدم كيفية استخدام ColPali لاسترجاع الصفحات بناءً على استعلام معين.</p>
texts.add(<spanclass="hljs-string">"An efficient system relies on a robust analyzer to correctly process text for various applications."</span>);
<pre><codetranslate="no"class="language-javascript"><spanclass="hljs-comment">// javascrip# Sample text to analyze</span>
135
+
<spanclass="hljs-keyword">const</span> text = <spanclass="hljs-string">"An efficient system relies on a robust analyzer to correctly process text for various applications."</span>
136
+
137
+
<spanclass="hljs-comment">// Run analyzer</span>
138
+
<spanclass="hljs-keyword">const</span> result = <spanclass="hljs-keyword">await</span> client.<spanclass="hljs-title function_">run_analyzer</span>({
texts := []<spanclass="hljs-type">string</span>{<spanclass="hljs-string">"An efficient system relies on a robust analyzer to correctly process text for various applications."</span>}
<li><p><strong>مرشحات</strong> مدمجة: تم تكوينها مسبقًا بواسطة Milvus، وتتطلب الحد الأدنى من الإعداد. يمكنك استخدام هذه المرشحات خارج الصندوق من خلال تحديد أسمائها. المرشحات أدناه مدمجة للاستخدام المباشر:</p>
222
256
<ul>
223
-
<li><p><codetranslate="no">lowercase</code>: تحويل النص إلى أحرف صغيرة، مما يضمن مطابقة غير حساسة لحالة الأحرف. لمزيد من التفاصيل، راجع <ahref="/docs/ar/lowercase-filter.md">الأحرف الصغيرة</a>.</p></li>
257
+
<li><p><codetranslate="no">lowercase</code>: يحول النص إلى أحرف صغيرة، مما يضمن مطابقة غير حساسة لحالة الأحرف. لمزيد من التفاصيل، راجع <ahref="/docs/ar/lowercase-filter.md">الأحرف الصغيرة</a>.</p></li>
224
258
<li><p><codetranslate="no">asciifolding</code>: يقوم بتحويل الأحرف غير ASCII إلى معادلات ASCII، مما يبسط معالجة النص متعدد اللغات. لمزيد من التفاصيل، راجع <ahref="/docs/ar/ascii-folding-filter.md">طي ASCII</a>.</p></li>
225
259
<li><p><codetranslate="no">alphanumonly</code>: يحتفظ بالأحرف الأبجدية الرقمية فقط عن طريق إزالة الأحرف الأخرى. لمزيد من التفاصيل، راجع <ahref="/docs/ar/alphanumonly-filter.md">Alphanumonly</a>.</p></li>
226
260
<li><p><codetranslate="no">cnalphanumonly</code>: يزيل الرموز التي تحتوي على أي أحرف غير الأحرف الصينية أو الأحرف الإنجليزية أو الأرقام. لمزيد من التفاصيل، ارجع إلى <ahref="/docs/ar/cnalphanumonly-filter.md">Cnalphanumonumonly</a>.</p></li>
@@ -414,13 +448,44 @@ result = client.run_analyzer(sample_text, analyzer_params_built_in)
0 commit comments