الكانادا Dataset

لاب توب

مجموعة بيانات عالية الجودة باللغة الكانادية حول مراكز الاتصال والمحادثات العامة والمونولوجات المكتوبة والوسائط (البودكاست) للذكاء الاصطناعي ونماذج الكلام

نظرة عامة

العنوان (اللغة)

مجموعة بيانات اللغة الكانادية

أنواع مجموعات البيانات

مركز الاتصال، المحادثة العامة، بيانات الوسائط، المونولوج المكتوب

الدولة

الهند

الوصف

تتضمن مجموعة البيانات هذه محادثات هاتفية غير مكتوبة بين العميل والوكيل (من 5 إلى 15 دقيقة)، وملفات صوتية أو فيديو قابلة للترخيص في المجال العام مثل المقابلات والبودكاست مع من 1 إلى 5 مشاركين (من 15 إلى 60 دقيقة)، وحوارات مكتوبة حيث يقدم متحدث واحد محتوى محدد مسبقًا للتدريب وتقييم نماذج الكلام واللغة.

الحلول المقترحة

ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة

تفاصيل مجموعة البيانات

نوع مجموعة البيانات معدل أخذ العينات سبيكرات قناة مجموع الساعات إجمالي عدد المتحدثين
مركز الاتصال 8 كيلو هرتز 2 المتحدثون مزدوج 59:57:02 494
مركز الاتصال 16 كيلو هرتز 2 المتحدثون بالأبيض والأسود 195:26:56 9,504
محادثة عامة 8 كيلو هرتز 2 المتحدثون مزدوج 141:27:15 424
بيانات الوسائط 16 كيلو هرتز مكبرات صوت متعددة بالأبيض والأسود 14:19:52 124
مناجاة مكتوبة 24 كيلو هرتز رئيس واحد بالأبيض والأسود 500:00:00 على طلب

عملاء متميزون

تمكين الفرق لبناء منتجات ذكاء اصطناعي رائدة عالميًا.

Amazon
جوجل
مایکروسوفت
شايب اتصل بنا

لا تستطيع أن تجد ما تبحث عنه؟

يتم جمع مجموعات بيانات جاهزة جديدة عبر جميع أنواع البيانات

اتصل بنا الآن للتخلص من مخاوفك المتعلقة بجمع بيانات التدريب على الصوت / الكلام

  • هذا الحقل لأغراض التحقق من صحة وينبغي أن تترك دون تغيير.
  • بالتسجيل ، أنا أتفق مع Shaip سياسة الخصوصية و شروط الخدمة وأقدم موافقتي على تلقي اتصالات تسويقية B2B من Shaip.