تصور البيانات عالية الأبعاد دون عناء باستخدام t-SNE. اكتشف الأنماط واستكشف المجموعات وعزز رؤى التعلم الآلي اليوم!
يُعد التضمين العشوائي الموزّع t-التضمين العشوائي للجوار (t-SNE) تقنية قوية تُستخدم في التعلم الآلي لتصور البيانات عالية الأبعاد في فضاء منخفض الأبعاد، عادةً ما يكون ثنائي أو ثلاثي الأبعاد. تعتبر هذه الطريقة فعالة بشكل خاص في استكشاف وفهم مجموعات البيانات المعقدة من خلال الكشف عن الأنماط والبنى الأساسية التي قد لا تكون واضحة في الفضاء الأصلي عالي الأبعاد. من خلال تقليل الأبعاد مع الحفاظ على العلاقات المحلية بين نقاط البيانات، تتيح طريقة t-SNE إمكانية التصور والتحليل البديهي، مما يجعلها أداة قيمة في تحليل البيانات الاستكشافية وسير عمل التعلم الآلي.
يعمل t-SNE عن طريق إنشاء توزيع احتمالي على أزواج من الأجسام عالية الأبعاد بطريقة تجعل الأجسام المتشابهة تُمنح احتمالية أعلى بينما تُمنح الأجسام غير المتشابهة احتمالية أقل. ثم تحدد بعد ذلك توزيعًا احتماليًا متشابهًا على النقاط في الخريطة منخفضة الأبعاد، وتقلل من تباعد كولباك-ليبلر بين التوزيعين فيما يتعلق بمواقع النقاط في الخريطة. صُممت هذه الطريقة للحفاظ على الجوار المحلي، ما يعني أن النقاط القريبة من بعضها البعض في الفضاء عالي الأبعاد تميل إلى أن تكون قريبة من بعضها البعض في التمثيل منخفض الأبعاد.
تعرف على المزيد حول المفاهيم ذات الصلة في تقليل الأبعاد وكيف يساعد في التعلم الآلي.
على الرغم من أن t-SNE هي تقنية لتقليل الأبعاد، إلا أنها تختلف بشكل كبير عن الطرق الأخرى مثل تحليل المكونات الرئيسية (PCA). يركز PCA على الحفاظ على البنية العامة للبيانات من خلال تعظيم التباين، بينما يركز t-SNE على الحفاظ على الأحياء المحلية. هذا التمييز يجعل من t-SNE مفيدًا بشكل خاص لتصور المجموعات والكشف عن البنى الخفية داخل البيانات. هناك تقنية أخرى ذات صلة وهي تقنية K-Means Clustering، والتي تُستخدم لتقسيم البيانات إلى مجموعات. في حين يمكن استخدام كلاهما معًا، إلا أن t-SNE هي في المقام الأول أداة تصوّر، في حين أن K-Means هي خوارزمية تجميع.
في المعلوماتية الحيوية، يُستخدم t-SNE على نطاق واسع لتصور البيانات الجينومية المعقدة. على سبيل المثال، يمكن أن يساعد الباحثين في تحديد مجموعات الخلايا المتميزة في بيانات تسلسل الحمض النووي الريبي أحادي الخلية. ومن خلال اختزال ملامح التعبير الجيني عالية الأبعاد إلى خريطة ثنائية الأبعاد، يمكن أن تكشف تقنية t-SNE عن مجموعات من الخلايا ذات أنماط تعبير متشابهة، مما يساعد في اكتشاف أنواع أو حالات خلوية جديدة.
استكشف تأثير الذكاء الاصطناعي على التحليل الجينومي باستخدام التعلم الآلي.
يمكن أيضًا تطبيق t-SNE في التعرف على الصور لتصور مساحات السمات التي تعلمتها نماذج التعلم العميق. على سبيل المثال، عند تدريب الشبكة العصبية التلافيفية (CNN) لتصنيف الصور، يمكن استخدام t-SNE لتصور كيفية فصل الشبكة بين الفئات المختلفة في فضاء الميزة. يمكن أن يوفر ذلك نظرة ثاقبة لعملية اتخاذ القرار في النموذج ويساعد في تحديد المجالات المحتملة للتحسين.
اكتشف استخدام Ultralytics YOLO لأنظمة كشف الصور المتقدمة.
تتضمن t-SNE عملية عشوائية، بمعنى أنها تستخدم العشوائية لتحقيق نتائجها. تبدأ الخوارزمية بحساب التشابهات الثنائية بين نقاط البيانات في الفضاء عالي الأبعاد باستخدام توزيع غاوسي. ثم تقوم بعد ذلك بتعيين هذه النقاط إلى فضاء أقل بُعدًا وتستخدم توزيعًا على شكل حرف t لحساب أوجه التشابه. تقوم عملية التحسين بتعديل مواضع النقاط في الفضاء منخفض الأبعاد بشكل متكرر لتقليل التباعد بين التوزيعين الاحتماليين.
بالإضافة إلى التصور، يمكن استخدام t-SNE لاكتساب نظرة ثاقبة في بنية مساحات الميزات في نماذج التعلم العميق. وهي ذات قيمة خاصة لفهم كيفية تمييز النماذج بين الفئات أو الفئات المختلفة. من خلال تصور الطبقات الوسيطة للشبكة العصبية، يمكن للباحثين تشخيص سلوك النموذج، وتحديد المشكلات المحتملة، وتحسين بنية النموذج.
تعرف على المزيد حول تقنيات استخراج الميزات في الذكاء الاصطناعي وأهميتها.
تُعد t-SNE أداة لا تقدر بثمن لتصور وتفسير البيانات عالية الأبعاد في التعلم الآلي. إن قدرتها على الحفاظ على البنى المحلية تجعلها فعالة بشكل خاص في الكشف عن التكتلات والأنماط داخل مجموعات البيانات المعقدة. سواء استُخدمت لاستكشاف البيانات الجينومية، أو فهم نماذج التعلم العميق، أو تصور نتائج معالجة اللغة الطبيعية، فإن t-SNE توفر وسيلة قوية لاكتساب رؤى ثاقبة في البنية الأساسية للبيانات.
استكشف كيف يمكن لأدوات الذكاء الاصطناعيUltralytics'Vision AI Tools تعزيز مشاريع الذكاء الاصطناعي الخاصة بك من خلال دمج هذه التقنيات المتقدمة.