مجموعة البيانات الهندية

مجموعة البيانات الهندية

مجموعة بيانات عالية الجودة باللغة الهندية لمراكز الاتصال والمحادثات العامة والبودكاست لنماذج الذكاء الاصطناعي والتعرف التلقائي على الكلام

نظرة عامة

العنوان (اللغة)

مجموعة بيانات اللغة الهندية

أنواع مجموعات البيانات

مركز الاتصال، المحادثة العامة، الوسائط (بودكاست)، المونولوج المكتوب

الدولة

الهند

الوصف

تتوفر محادثات هاتفية غير مكتوبة بين شخصين، تتراوح مدتها بين 15 و60 دقيقة، بالإضافة إلى ملفات صوتية أو مرئية قابلة للترخيص، مثل المقابلات والبودكاست، مع مشارك واحد إلى خمسة مشاركين في نفس النطاق. بالإضافة إلى ذلك، تتراوح مدة التسجيلات الصوتية الفردية عادةً بين 5 و30 ثانية، كما تتوفر بيانات المونولوج المكتوبة.

الحلول المقترحة

ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة

تفاصيل مجموعة البيانات

نوع مجموعة البيانات معدل أخذ العينات سبيكرات قناة مجموع الساعات إجمالي عدد المتحدثين
مركز الاتصال 8 كيلو هرتز 2 المتحدثون مزدوج 70:45:51 على طلب
مركز الاتصال 8 كيلو هرتز 2 المتحدثون بالأبيض والأسود 20,000:00:00 على طلب
مركز الاتصال 16 كيلو هرتز 2 المتحدثون بالأبيض والأسود 29:17:20 261
مركز الاتصال 16 كيلو هرتز 2 المتحدثون مزدوج 400:27:10 1200
محادثة عامة 8 كيلو هرتز 2 المتحدثون مزدوج 47:48:40 224
بيانات الوسائط 16 كيلو هرتز مكبرات صوت متعددة بالأبيض والأسود 227:57:43 438
مناجاة مكتوبة 48 كيلو هرتز رئيس واحد بالأبيض والأسود 2,866:00:00 3,988
مناجاة مكتوبة 24 كيلو هرتز رئيس واحد بالأبيض والأسود 29,000:00:00 على طلب

عملاء متميزون

تمكين الفرق لبناء منتجات ذكاء اصطناعي رائدة عالميًا.

Amazon
جوجل
مایکروسوفت
شايب اتصل بنا

لا تستطيع أن تجد ما تبحث عنه؟

يتم جمع مجموعات بيانات جاهزة جديدة عبر جميع أنواع البيانات

اتصل بنا الآن للتخلص من مخاوفك المتعلقة بجمع بيانات التدريب على الصوت / الكلام

  • هذا الحقل لأغراض التحقق من صحة وينبغي أن تترك دون تغيير.
  • بالتسجيل ، أنا أتفق مع Shaip سياسة الخصوصية و شروط الخدمة وأقدم موافقتي على تلقي اتصالات تسويقية B2B من Shaip.