تي اف-اي دي دف

معامل التي اف-اي دي دف (تردد المصطلح-معكوس تردد الوثيقة(TF-IDF)) هو معامل غالبا ما يستخدم في استرجاع المعلومات وتعدين النصوص.[1][2][3] هذا المعامل هو مقياس إحصائي يستخدم لتقييم مدى أهمية وجود كلمة في مستند معين في ذخيرة النصوص. الأهمية تزيد نسبيا بزيادة عدد مرات ظهور الكلمة أو المصطلح في المستند ولكن تُقَأبَل بتردد الكلمة في الذخيرة بشكل عام. غالبا ما تستخدم الأشكال المختلفة للمعامل، بواسطة محركات البحث كأداة مركزية في لتقييم وترتب الوثائق حسب الصلة وفقا لاستعلام المستخدم.

واحدة من أبسط دوال الترتيب تحسب بواسطة جمع المعامل لكل مصطلح من مصطلحات الاستعلام؛ العديد من دوال الترتيب الأكثر تطورا هو شكل من أشكال هذا النموذج البسيط.

مراجع

  1. Probability estimates in practicein Introduction to Information Retrieval. نسخة محفوظة 14 فبراير 2017 على موقع واي باك مشين.
  2. "TFIDF statistics | SAX-VSM". مؤرشف من الأصل في 07 نوفمبر 2017. الوسيط |CitationClass= تم تجاهله (مساعدة); تحقق من التاريخ في: |تاريخ أرشيف= (مساعدة)
  3. Bollacker, Kurt D.; Lawrence, Steve; Giles, C. Lee (1998-01-01). "CiteSeer: An Autonomous Web Agent for Automatic Retrieval and Identification of Interesting Publications". Proceedings of the Second International Conference on Autonomous Agents. New York, NY, USA: ACM: 116–123. doi:10.1145/280765.280786. ISBN 0-89791-983-1. مؤرشف من الأصل في 3 فبراير 2020. الوسيط |CitationClass= تم تجاهله (مساعدة)
    • بوابة إحصاء
    • بوابة تقنية المعلومات
    • بوابة علم الحاسوب
    This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.