مجموعة البيانات العربية
مجموعة البيانات العربية
High-Quality Arabic General Conversation, and Podcast Dataset for AI & Speech Models
نظرة عامة
العنوان
مجموعة بيانات اللغة العربية
نوع مجموعة البيانات
محادثة عامة
الوصف
محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، العربية من دول الخليج.
الحلول المقترحة
ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
تفاصيل مجموعة البيانات
مجموع الساعات
292
معدل العينة
8 كيلو هرتز
قناة الصوت
مزدوج
منصة التسجيل
الحاسوب
تنسيق الصوت
. الرعايا
تنسيق النسخ
.json
WER (٪)
5
ديموغرافيات مجموعة البيانات
الدولة
العربيه
اللغة
العربيه
الجنس
أنثى 838 ذكر 1209 مجهول 78
عدد مكبرات الصوت
706
العمر
18-50
نظرة عامة
العنوان
مجموعة بيانات اللغة العربية
نوع مجموعة البيانات
تحويل النص إلى كلام
الوصف
التسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانية.
الحلول المقترحة
ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
تفاصيل مجموعة البيانات
مجموع الساعات
1,947
معدل العينة
48 كيلو هرتز
قناة الصوت
بالأبيض والأسود
منصة التسجيل
تطبيق الموبايل
تنسيق الصوت
. الرعايا
تنسيق النسخ
.json
WER (٪)
5
ديموغرافيات مجموعة البيانات
الدولة
العربيه
اللغة
العربيه
الجنس
أنثى 838 ذكر 1209 مجهول 78
عدد مكبرات الصوت
2,125
العمر
18-50
عملاء متميزون
تمكين الفرق لبناء منتجات ذكاء اصطناعي رائدة عالميًا.
لا تستطيع أن تجد ما تبحث عنه؟
يتم جمع مجموعات بيانات جاهزة جديدة عبر جميع أنواع البيانات
اتصل بنا الآن للتخلص من مخاوفك المتعلقة بجمع بيانات التدريب على الصوت / الكلام