مجموعة بيانات اللغة العربية والتايلاندية والفيتنامية والهندية والإنجليزية والصينية

مربع حدود + نص

مجموعة بيانات اللغة العربية والتايلاندية والفيتنامية والهندية والإنجليزية والصينية

حالة الاستخدام: التعرف الضوئي على الحروف

شكل: صورة

عدد المشاهدات: 150k

الشرح: نعم

X

الوصف: مجموعة بيانات اللغة العربية والتايلاندية والفيتنامية والهندية والإنجليزية والصينية

مجموعة بيانات النصوص العربية

مربع حدود + نص

مجموعة بيانات النصوص العربية

حالة الاستخدام: التعرف الضوئي على الحروف

شكل: صورة

عدد المشاهدات: 1k

الشرح: نعم

X

الوصف: تحتوي مجموعة البيانات النصية العربية على مجموعة من عينات النصوص المكتوبة باللغة العربية. وهي تشمل أشكالًا مختلفة من المحتوى، مثل المقالات الإخبارية، ومنشورات وسائل التواصل الاجتماعي، والأدب، والحوار، والتي تغطي موضوعات وأساليب كتابة مختلفة. تُستخدم مجموعة البيانات هذه لمهام مثل معالجة اللغة الطبيعية (NLP)، وتصنيف النصوص، وتحليل المشاعر، والترجمة الآلية في تطبيقات اللغة العربية.

مجموعة بيانات باللغات الصينية والإنجليزية والتبتية والأويغورية

مربع حدود + نص

مجموعة بيانات باللغات الصينية والإنجليزية والتبتية والأويغورية

حالة الاستخدام: التعرف الضوئي على الحروف

شكل: صورة

عدد المشاهدات: 38k

الشرح: نعم

X

الوصف: مجموعة بيانات باللغات الصينية والإنجليزية والتبتية والأويغورية

مجموعة بيانات القائمة باللغتين الصينية والإنجليزية

مربع حدود + نص

مجموعة بيانات القائمة باللغتين الصينية والإنجليزية

حالة الاستخدام: التعرف الضوئي على الحروف

شكل: صورة

عدد المشاهدات: 60k

الشرح: نعم

X

الوصف: تحتوي مجموعة بيانات قائمة الطعام باللغتين الصينية والإنجليزية على صور أو عينات نصية لقوائم الطعام بالمطاعم التي تتميز باللغتين الصينية والإنجليزية. وهي تتضمن خطوطًا وتخطيطات وهياكل قائمة طعام متنوعة، وتقدم أسماء الأطباق وأوصافها وأسعارها ثنائية اللغة. تعد مجموعة البيانات هذه مفيدة لمهام مثل التعرف الضوئي على الحروف (OCR) والترجمة الآلية ورقمنة القائمة في الإعدادات متعددة اللغات.

مجموعة بيانات التراكيب المكتوبة بخط اليد باللغة الصينية

مربع حدود + نص

مجموعة بيانات التراكيب المكتوبة بخط اليد باللغة الصينية

حالة الاستخدام: التعرف الضوئي على الحروف

شكل: صورة

عدد المشاهدات: 3k

الشرح: نعم

X

الوصف: تحتوي مجموعة بيانات التراكيب المكتوبة بخط اليد الصينية على عينات من النصوص الصينية المكتوبة بخط اليد، بما في ذلك التراكيب والمقالات والنصوص الطويلة الأخرى. وتتميز بأنماط مختلفة من الكتابة اليدوية ومستويات التعقيد، وتُستخدم في مهام مثل التعرف على الكتابة اليدوية وتحليل النصوص وتدريب نموذج التعلم الآلي.

مجموعة بيانات WiFi الصينية

مربع حدود + نص

مجموعة بيانات WiFi الصينية

حالة الاستخدام: التعرف الضوئي على الحروف

شكل: صورة

عدد المشاهدات: 1k

الشرح: نعم

X

الوصف: تتكون مجموعة بيانات مطالبات WIFI الصينية من عينات نصية موجودة في مطالبات WIFI وشاشات تسجيل الدخول المكتوبة باللغة الصينية. وعادةً ما تتضمن مطالبات وتعليمات ورسائل خطأ مختلفة تتعلق بالاتصال بشبكات WIFI أو إدارتها. تُستخدم مجموعة البيانات هذه لمهام مثل التعرف على النص ومعالجة اللغة الطبيعية وتحسين واجهات المستخدم للاتصال بالشبكة.

مجموعة بيانات الكتابة اليدوية باللغتين الإنجليزية والصينية

مربع حدود + نص

مجموعة بيانات الكتابة اليدوية باللغتين الإنجليزية والصينية

حالة الاستخدام: التعرف الضوئي على الحروف

شكل: صورة

عدد المشاهدات: 12k

الشرح: نعم

X

الوصف: تحتوي مجموعة بيانات الكتابة اليدوية باللغتين الإنجليزية والصينية على عينات مكتوبة بخط اليد باللغتين الإنجليزية والصينية، تعرض أنماط الكتابة المختلفة وتعقيدات الأحرف. تُستخدم عادةً لتدريب وتقييم نماذج التعرف على الكتابة اليدوية، ودعم تحليل النصوص المتعددة اللغات، وغير ذلك من الأبحاث ذات الصلة. تتضمن مجموعة البيانات مجموعة متنوعة من الأحرف والأرقام والكلمات والجمل باللغتين.

مجموعة بيانات تصميمات المتاجر باللغتين الإنجليزية والصينية

مربع حدود + نص

مجموعة بيانات تصميمات المتاجر باللغتين الإنجليزية والصينية

حالة الاستخدام: التعرف الضوئي على الحروف

شكل: صورة

عدد المشاهدات: 30k

الشرح: نعم

X

الوصف: تتضمن مجموعة بيانات لافتات المتاجر الإنجليزية والصينية صورًا لعلامات المتاجر التي تحتوي على نصوص باللغتين الإنجليزية والصينية. وهي تلتقط عناصر لافتات مختلفة مثل أسماء المتاجر والإعلانات والعروض الترويجية والاتجاهات، المعروضة بخطوط وأنماط وتنسيقات متنوعة. تُستخدم مجموعة البيانات هذه لمهام مثل اكتشاف النص والتعرف عليه وفهم المشهد متعدد اللغات وتحسين نماذج الرؤية الحاسوبية لتفسير اللافتات ثنائية اللغة.

مجموعة بيانات نصية بالزاوية الخاصة باللغتين الإنجليزية والصينية

مربع حدود + نص

مجموعة بيانات نصية بالزاوية الخاصة باللغتين الإنجليزية والصينية

حالة الاستخدام: التعرف الضوئي على الحروف

شكل: صورة

عدد المشاهدات: 50k

الشرح: نعم

X

الوصف: تحتوي مجموعة بيانات النصوص ذات الزوايا الخاصة باللغتين الإنجليزية والصينية على صور لنصوص معروضة بزوايا واتجاهات مختلفة باللغتين الإنجليزية والصينية. وهي تتضمن نصوصًا من مصادر مثل اللافتات والإعلانات والمستندات التي لا يتم تقديمها بتنسيقات أفقية قياسية. تُستخدم مجموعة البيانات هذه لتدريب وتقييم نماذج اكتشاف النصوص والتعرف عليها، وخاصة تلك القادرة على التعامل مع النصوص في اتجاهات ومنظورات غير تقليدية.

مجموعة بيانات القائمة الإنجليزية

مربع حدود + نص

مجموعة بيانات القائمة الإنجليزية

حالة الاستخدام: التعرف الضوئي على الحروف

شكل: صورة

عدد المشاهدات: 20k

الشرح: نعم

X

الوصف: تتضمن مجموعة بيانات القائمة الإنجليزية صورًا أو عينات نصية لقوائم المطاعم المكتوبة باللغة الإنجليزية. وتتميز بمجموعة متنوعة من الخطوط والتخطيطات وأنماط التنسيق، مع محتوى يتراوح من أسماء الأطباق إلى الأوصاف والأسعار. غالبًا ما تُستخدم مجموعة البيانات هذه لمهام مثل التعرف الضوئي على الحروف (OCR) واستخراج النص ورقمنة القائمة في التطبيقات المتعلقة بالطعام.

مجموعة بيانات نصية للمشاهد الإنجليزية

مربع حدود + نص

مجموعة بيانات نصية للمشاهد الإنجليزية

حالة الاستخدام: التعرف الضوئي على الحروف

شكل: صورة

عدد المشاهدات: 33k

الشرح: نعم

X

الوصف: تتكون مجموعة بيانات نصوص المشاهد الإنجليزية من صور تحتوي على مشاهد طبيعية مع نص إنجليزي مضمن. يظهر النص بأشكال مختلفة، مثل اللافتات واللوحات الإعلانية والملصقات، غالبًا بخطوط وأحجام واتجاهات مختلفة. تُستخدم مجموعة البيانات هذه عادةً لتدريب واختبار النماذج في مهام اكتشاف النص والتعرف عليه وفهم المشاهد.

مجموعة بيانات نص مكتوب بخط اليد

مجموعة بيانات نص مكتوب بخط اليد

حالة الاستخدام: وثيقة منظمة العفو الدولية

شكل: HEIC (الصور) و. mov (مقاطع الفيديو)

عدد المشاهدات: 94053

الشرح: لا

X

الوصف: صور حية مع نص مكتوب بخط اليد للغة اليابانية والكورية والروسية

جهاز تسجيل: كاميرا iPhone و iPad

شرط التسجيل: - الإضاءة / الوهج العدواني - تشغيل فلاش الكاميرا - الضوء الملون - الإضاءة المنخفضة ، عدم وجود فلاش الكاميرا - عادي

مجموعة بيانات اللغة اليابانية والكورية

مربع حدود + نص

مجموعة بيانات اللغة اليابانية والكورية

حالة الاستخدام: التعرف الضوئي على الحروف

شكل: صورة

عدد المشاهدات: 40k

الشرح: نعم

X

الوصف: تتضمن مجموعة البيانات الخاصة باللغتين اليابانية والكورية عينات نصية باللغتين اليابانية والكورية. وهي تتميز بمجموعة من المحتويات مثل الجمل والعبارات والكلمات، والتي تشمل سياقات وأنماط مختلفة. تُستخدم مجموعة البيانات هذه لمهام مثل معالجة اللغة الطبيعية (NLP)، والترجمة الآلية، وتحليل النصوص في التطبيقات متعددة اللغات.