كتالوج البيانات الطبية للذكاء الاصطناعي في مجال الرعاية الصحية
مجموعات بيانات الرعاية الصحية / الطبية الجاهزة لبدء مشروع الذكاء الاصطناعي للرعاية الصحية
مجموعات البيانات الطبية والرعاية الصحية لتعلم الآلة
ما الذي يتضمنه كتالوج بيانات شيب الطبية؟
يُعدّ كتالوج بيانات Shaip الطبية مكتبة جاهزة للاستخدام ومتوافقة مع قانون HIPAA، تضمّ بيانات تدريبية طبية مجهولة الهوية تغطي 31 تخصصًا طبيًا، بما في ذلك 257,977 ساعة من التسجيلات الصوتية لإملاءات الأطباء، وسجلات طبية مكتوبة، وسجلات صحية إلكترونية، ومجموعات بيانات متعددة الوسائط. كل مجموعة بيانات مرخصة للاستخدام التجاري في تدريب الذكاء الاصطناعي، وتُشحن مع ضمانات إخفاء الهوية بموجب اتفاقية Safe Harbor أو تحديد الخبراء.
بيانات صوتية لإملاء الطبيب
تتضمن مجموعة البيانات الخاصة بنا المخصصة للرعاية الصحية ملفات صوتية عبر 31 تخصصًا يحددها الأطباء والتي تصف الحالة السريرية للمرضى وخطة الرعاية بناءً على لقاءات الطبيب والمريض في البيئة السريرية.
الملفات الصوتية لإملاء الطبيب غير المألوف:
- 257,977 ساعة من مجموعة بيانات إملاء الكلام للأطباء في العالم الحقيقي من 31 تخصصًا لتدريب نماذج الكلام في الرعاية الصحية
- تم التقاط صوت الإملاء من أجهزة مختلفة مثل إملاء الهاتف (54.3٪) والمسجل الرقمي (24.9٪) وميكروفون الكلام (5.4٪) والهواتف الذكية (2.7٪) وغير معروف (12.7٪)
- ملفات الصوت والنصوص المنقحة PII التي تلتزم بإرشادات Safe Harbor بما يتوافق مع HIPAA
السجلات الطبية المنسوخة
تشمل السجلات الطبية المُنسوخة تسجيل محادثات الطبيب والمريض، وتسجيل التقارير الطبية، والتقييم الطبي. وتساعد هذه السجلات في رسم خريطة للتاريخ الطبي للمريض للزيارات المستقبلية، كما تُشكل مرجعًا للأطباء، وتُساعد في تقييم حالته الحالية واقتراح العلاج المناسب.
السجلات الطبية المنسوخة خارج الرفوف:
- نسخ 257,977،31 ساعة من إملاء الأطباء في العالم الحقيقي من XNUMX تخصصًا لتدريب نماذج النطق الخاصة بالرعاية الصحية
- السجلات الطبية المنسوخة من أنواع العمل المختلفة مثل تقرير العمليات ، ملخص التفريغ ، مذكرة الاستشارة ، مذكرة القبول ، ملاحظة ED ، مذكرة العيادة ، تقرير الأشعة ، إلخ.
- ملفات الصوت والنصوص المنقحة PII التي تلتزم بإرشادات Safe Harbor بما يتوافق مع HIPAA
السجلات الصحية الإلكترونية (EHR)
السجلات الصحية الإلكترونية أو السجلات الصحية الإلكترونية هي سجلات طبية تحتوي على التاريخ الطبي للمريض ، والتشخيصات ، والوصفات الطبية ، وخطط العلاج ، ومواعيد التطعيم أو التطعيم ، والحساسية ، وصور الأشعة (التصوير المقطعي المحوسب ، والتصوير بالرنين المغناطيسي ، والأشعة السينية) ، والاختبارات المعملية والمزيد.
السجلات الصحية الإلكترونية الجاهزة (EHR):
- 5.1M + سجلات وملفات صوتية للطبيب في 31 تخصصًا
- السجلات الطبية ذات المعيار الذهبي في العالم الحقيقي لتدريب Clinical NLP ونماذج Document AI الأخرى
- معلومات البيانات الوصفية مثل MRN (مجهول الهوية) ، تاريخ القبول ، تاريخ الخروج ، طول أيام الإقامة ، الجنس ، فئة المريض ، الدافع ، الفئة المالية ، الولاية ، التخلص من التفريغ ، العمر ، DRG ، وصف DRG ، السداد بالدولار ، AMLOS ، GMLOS ، مخاطر معدل الوفيات ، خطورة المرض ، الهامور ، الرمز البريدي للمستشفى ، إلخ.
- السجلات الطبية من مختلف الولايات الأمريكية والمنطقة - الشمال الشرقي (46٪) ، الجنوب (9٪) ، الغرب الأوسط (3٪) ، الغرب (28٪) ، أخرى (14٪)
- السجلات الطبية التي تنتمي إلى جميع فئات المرضى المشمولة - المرضى الداخليون ، والعيادات الخارجية (السريرية ، وإعادة التأهيل ، والمتكررة ، والجراحية ، والرعاية النهارية) ، والطوارئ.
- السجلات الطبية التي تنتمي إلى جميع الفئات العمرية للمرضى أقل من 10 سنوات (7.9٪) ، 11-20 سنة (5.7٪) ، 21-30 سنة (10.9٪) ، 31-40 سنة (11.7٪) ، 41-50 سنة (10.4٪) ) ، 51-60 عامًا (13.8٪) ، 61-70 عامًا (16.1٪) ، 71-80 عامًا (13.3٪) ، 81-90 عامًا (7.8٪) ، 90+ عامًا (2.4٪)
- نسبة جنس المريض 46٪ (ذكور) و 54٪ (إناث)
- تلتزم مستندات PII المحظورة بإرشادات Safe Harbor وفقًا لقانون HIPAA
خمسة أسباب تدفع المشترين رخصة شيب بدلاً من خياطتها معاً.
يوجد فهرس بيانات شيب الطبية لأن معظم فرق الذكاء الاصطناعي في مجال الرعاية الصحية تخسر من تسعة إلى اثني عشر شهرًا يتم الحصول على بيانات تدريب متوافقة قبل تدريب أي نموذج. إليكم ما يتغير عند استرجاع تلك البيانات.
نطاق الكتالوج لا تستطيع معظم الفرق مجاراته.
يشمل كتالوج شايب خلال 257,977 ساعة من إملاءات الأطباء، نسخ من 31 تخصصًا طبيًاوسجلات الصحة الإلكترونية التي تغطي جميع الفئات العمرية للمرضى - وهو نوع من الحجم يسمح للمشترين تدريب وتقييم النماذج دون الحاجة إلى دمج عشرات مجموعات البيانات المفتوحة.
الامتثال هو شرط أساسي، وليس ميزة.
تأتي جميع مجموعات البيانات الطبية الخاصة بـ Shaip مع إخفاء الهوية وفقًا لقانون HIPAA Safe Harbor بشكل افتراضييتم تقديم تقرير من خبير عند الطلب، ويتم التعامل مع الأمور بما يتوافق مع اللائحة العامة لحماية البيانات (GDPR)، وتكون الجهات المشمولة جاهزة لاتفاقية الشراكة التجارية (BAA). لا يحتاج المشترون إلى تعديل الامتثال لاحقًا.
أخصائيون مدربون في مجال الرعاية الصحية، وليسوا عمالاً عاديين يعملون عبر الإنترنت.
يتم إجراء عمليات الشرح والنسخ وضمان الجودة على فهرس شيب الطبي بواسطة أخصائيون مدربون في مجال الرعاية الصحية. تتضمن عملية Shaip ضمان الجودة متعدد الطبقات والتحقق من الصحة الذي يتم إجراؤه بواسطة الإنسان وفقًا لمعايير الدقة السريرية.
متوفر اليوم جاهزاً، ومصنوع حسب الطلب.
بإمكان المشترين الحصول على تراخيص مجموعات بيانات Shaip الحالية فوراً أو طلب مجموعات بيانات مخصصة تتناسب مع خصائص ديموغرافية وجغرافية ولغات وطرائق محددة. دون تغيير الموردين أو إعادة إجراء مراجعة الامتثال.
متوفر في الأماكن التي تعمل بها فرق البيانات بالفعل.
تتوفر مجموعات بيانات السجلات الصحية الإلكترونية وبيانات إملاءات الأطباء التي تم إخفاء هوية أصحابها، والتي قام شايب بحذفها من قاعدة البيانات. سوق Dataricksمع إمكانية التسليم بتنسيقات تستخدمها فرق البيانات والتعلم الآلي بالفعل - JSON وCSV وWAV. تتوفر مجموعات بيانات نموذجية قبل أي التزام.
الأمان والامتثال
لا تستطيع أن تجد ما تبحث عنه؟
يتم جمع مجموعات بيانات طبية جديدة جاهزة عبر جميع أنواع البيانات
اتصل بنا الآن للتخلص من مخاوفك المتعلقة بجمع بيانات التدريب على الرعاية الصحية
الأسئلة الأكثر شيوعًا (FAQ)
1. ما هي مجموعات البيانات الطبية؟
تُعدّ مجموعات البيانات الطبية بيانات رعاية صحية تُستخدم لتدريب نماذج الذكاء الاصطناعي/التعلم الآلي وتقييمها وتحسينها. وقد تشمل هذه المجموعات تسجيلات صوتية لإملاءات الأطباء، وسجلات طبية مكتوبة، وسجلات صحية إلكترونية، وحوارات اصطناعية بين الطبيب والمريض، ومجموعات بيانات رعاية صحية متعددة الوسائط تجمع بين النصوص والكلام والبيانات السريرية المنظمة ذات الصلة.
2. ما الذي يتضمنه كتالوج بيانات شيب الطبية؟
يضم فهرس بيانات شيب الطبية تسجيلات صوتية لإملاءات الأطباء، وسجلات طبية مكتوبة، وسجلات صحية إلكترونية، وحوارات اصطناعية بين الطبيب والمريض، ومجموعات بيانات متعددة الوسائط تربط النصوص والكلام والبيانات السريرية المنظمة على مستوى المريض أو اللقاء. ويحتوي على 257,977 ساعة من التسجيلات الصوتية لإملاءات الأطباء في 31 تخصصًا طبيًا، وهو متاح للتدريب التجاري على الذكاء الاصطناعي.
3. هل تتوافق مجموعات البيانات الطبية الخاصة بـ Shaip مع قانون HIPAA؟
نعم. يتم إخفاء هوية مجموعات البيانات الطبية الخاصة بشركة Shaip بموجب اتفاقية HIPAA Safe Harbor افتراضيًا، مما يزيل 18 فئة من المعرّفات المحددة في قاعدة خصوصية HIPAA. كما يتوفر إخفاء الهوية عن طريق تحديد الخبراء عند اشتراط التصديق الإحصائي، وشركة Shaip جاهزة لاتفاقية BAA للكيانات المشمولة.
4. هل يمكن لمجموعات البيانات الطبية الخاصة بشركة Shaip أن تدعم اللائحة العامة لحماية البيانات (GDPR) ومتطلبات بيانات الرعاية الصحية الأخرى؟
نعم. يمكن إعداد مجموعات البيانات الطبية الخاصة بشركة Shaip لدعم قانون HIPAA وقانون GDPR ومتطلبات بيانات الرعاية الصحية الأخرى المعمول بها اعتمادًا على نطاق المشروع والموقع الجغرافي ونوع البيانات والمتطلبات التعاقدية.
5. هل يمكنني شراء مجموعات بيانات الرعاية الصحية جاهزة، أم يجب جمعها؟
كلا الخيارين متاحان. توفر Shaip مجموعات بيانات طبية جاهزة للاستخدام من خلال كتالوج Shaip للبيانات الطبية لتدريب الذكاء الاصطناعي التجاري. إذا تطلب المشروع لغةً أو بيانات ديموغرافية أو تخصصًا أو أسلوبًا علاجيًا أو بيئة سريرية محددة، فيمكن لـ Shaip أيضًا إجراء جمع بيانات طبية مخصصة وفقًا لمعايير الامتثال نفسها.
6. هل يمكن تخصيص مجموعات البيانات الطبية الخاصة بـ Shaip؟
نعم. بإمكان Shaip تخصيص مجموعات البيانات الطبية حسب التخصص، والفئة العمرية للمريض، والجنس، والموقع الجغرافي، واللغة، ونوع العلاج، والبيئة السريرية، والتنسيق، والحجم، ومتطلبات المشروع. يتم تحديد نطاق مجموعات البيانات المخصصة من خلال بيان العمل، وتلتزم بمعايير إخفاء الهوية والامتثال المعمول بها.
7. هل يمكنني الاطلاع على مجموعة بيانات نموذجية قبل الحصول على الترخيص؟
نعم. توفر Shaip مجموعات بيانات عينة تمثيلية بموجب اتفاقية عدم إفصاح، مما يتيح لفرق الذكاء الاصطناعي تقييم التنسيق والجودة والتغطية الديموغرافية ومدى ملاءمة النموذج قبل الترخيص. عادةً ما يكون الوصول إلى العينة الخطوة الأولى قبل الحصول على ترخيص قياسي أو طلب مجموعة بيانات مخصصة.
8. ما هي الصيغ التي يقدم بها Shaip مجموعات البيانات الطبية؟
توفر Shaip مجموعات بيانات طبية بتنسيقات جاهزة للذكاء الاصطناعي، بما في ذلك JSON وCSV وFHIR للسجلات المنظمة؛ وملفات WAV مع نصوص مصاحبة للصوت؛ وملفات نصوص لمجموعات بيانات الكلام واللغة. قد تتضمن مجموعات البيانات متعددة الوسائط ملفات بيان تربط النصوص والصوت والسجلات السريرية المنظمة.
9. كيف يضمن Shaip جودة مجموعات البيانات الطبية؟
تضمن Shaip جودة مجموعات البيانات الطبية من خلال مراجعة الخبراء، والتعليقات التوضيحية المتخصصة، وسير عمل التحقق، وفحوصات ضمان الجودة المنظمة. تساعد هذه العمليات على ضمان الدقة والموثوقية وجاهزية النموذج لتطوير الذكاء الاصطناعي في مجال الرعاية الصحية.
10. هل مجموعات البيانات الطبية الخاصة بـ Shaip قابلة للتوسع لمشاريع الذكاء الاصطناعي/التعلم الآلي الكبيرة؟
نعم. تتميز مجموعات البيانات الطبية من Shaip بقابليتها للتوسع لتناسب المشاريع التجريبية الصغيرة ومشاريع الذكاء الاصطناعي/التعلم الآلي المؤسسية. ويمكنها دعم المشاريع التي تتطلب كميات كبيرة من السجلات الطبية، والبيانات السريرية المنظمة، والنصوص المكتوبة، أو مئات الآلاف من ساعات التسجيلات الصوتية لإملاءات الأطباء.
11. هل يمكن دمج مجموعات البيانات الطبية من Shaip في نماذج وسير عمل الذكاء الاصطناعي الحالية؟
نعم. توفر Shaip مجموعات البيانات الطبية بتنسيقات جاهزة للاستخدام مثل JSON وCSV وFHIR وWAV وملفات النصوص. تدعم هذه التنسيقات التكامل مع سير العمل الحالي لتطوير نماذج الذكاء الاصطناعي والتعلم الآلي ومعالجة اللغات الطبيعية ومعالجة الكلام ونماذج التعلم الآلي في مجال الرعاية الصحية والنماذج متعددة الوسائط.
12. كم من الوقت يستغرق استلام مجموعة بيانات Shaip الطبية؟
يمكن عادةً تسليم مجموعات البيانات الطبية الجاهزة في غضون أيام بعد مراجعة العينات وتوقيع العقد وإتمام إجراءات الترخيص. أما الجداول الزمنية المخصصة لجمع البيانات فتعتمد على نطاق المشروع وحجم مجموعة البيانات ونوعها ومتطلبات الامتثال ومدى تعقيدها، ويتم تحديدها في بيان العمل.
13. كم تبلغ تكلفة مجموعات البيانات الطبية؟
تعتمد تكلفة مجموعات البيانات الطبية على نوع البيانات، وطريقة جمعها، وحجمها، ومتطلبات التخصيص، وشروط الترخيص، وجدول التسليم، ومتطلبات الامتثال. يمكن للفرق مشاركة متطلباتها عبر نموذج "اتصل بنا" للحصول على عرض سعر مخصص.
14. لماذا تعتبر مجموعات البيانات الطبية مهمة للذكاء الاصطناعي/التعلم الآلي في مجال الرعاية الصحية؟
تُعدّ مجموعات البيانات الطبية عالية الجودة ضرورية لتدريب نماذج الذكاء الاصطناعي في مجال الرعاية الصحية، لتكون دقيقة وموثوقة وذات فائدة سريرية. فهي تُسهم في تحسين التوثيق الطبي، ومعالجة اللغة الطبيعية السريرية، والتعرف على الكلام، والتلخيص، ودعم اتخاذ القرارات، والأتمتة، وسير عمل رعاية المرضى، وتحليل بيانات الرعاية الصحية.