مجموعة البيانات الدنماركية
بيانات دانسك
مجموعة بيانات عالية الجودة للمحادثة العامة باللغة الدنماركية، وتحويل النص إلى كلام، والبودكاست للذكاء الاصطناعي ونماذج الكلام
نظرة عامة
العنوان (اللغة)
مجموعة بيانات اللغة الدنماركية
أنواع مجموعات البيانات
مركز الاتصال، المحادثة العامة، بيانات الوسائط (بيانات البودكاست)، المونولوج المكتوب
الدولة
الدنمارك
الوصف
تتوفر محادثات هاتفية غير مكتوبة بين شخصين، تتراوح مدتها التقريبية بين 15 و60 دقيقة. كما تتراوح مدة ملفات الصوت أو الفيديو المتاحة للملكية العامة، مثل المقابلات أو البودكاست التي تضم من مشارك واحد إلى خمسة مشاركين، بين 15 و60 دقيقة. بالإضافة إلى ذلك، تتراوح مدة التسجيلات الصوتية الفردية باللغة الدنماركية الصادرة من الدنمارك عادةً بين 5 و30 ثانية.
الحلول المقترحة
ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
تفاصيل مجموعة البيانات
| نوع مجموعة البيانات | معدل أخذ العينات | سبيكرات | قناة | مجموع الساعات | إجمالي عدد المتحدثين |
|---|---|---|---|---|---|
| مركز الاتصال | 8 كيلو هرتز | 2 المتحدثون | بالأبيض والأسود | 2,000:00:00 | على طلب |
| محادثة عامة | 8 كيلو هرتز | 2 المتحدثون | مزدوج | 356:29:47 | 700 |
| بيانات الوسائط | 16 كيلو هرتز | مكبرات صوت متعددة | بالأبيض والأسود | 665:16:30 | 1,261 |
| مناجاة مكتوبة | 48 كيلو هرتز | رئيس واحد | بالأبيض والأسود | 2,496:00:00 | 2,825 |
عملاء متميزون
تمكين الفرق لبناء منتجات ذكاء اصطناعي رائدة عالميًا.
لا تستطيع أن تجد ما تبحث عنه؟
يتم جمع مجموعات بيانات جاهزة جديدة عبر جميع أنواع البيانات
اتصل بنا الآن للتخلص من مخاوفك المتعلقة بجمع بيانات التدريب على الصوت / الكلام