ذخيرة النصوص

في علم اللغة، الذخيرة أو ذخيرة النصوص هي مجموعة كبيرة ومنظمة من النصوص (التي أصبحت الآن عادة مخزنة ومعالجة إلكترونيا). وهي تستخدم للقيام بالتحليل الإحصائي واختبار الفرضيات، والتحقق من الوقائع أو التحقق من صحة القواعد اللغوية على فضاء محدد. يرتبط مفهوم ذخيرة النصوص بما يسما في اللغات اللاتينية "corpus" أو "corpora" فمن هنا يمكننا إعطاء اسم آخر إلى هذا المفهوم الجديد 'المدونة'. والشعبة التي تهتم بهذا المفهوم هي 'لسانيات المدونة'.

قد تحتوي الذخيرة على نصوص من لغة واحدة (ذخيرة أحادية اللغة) أو نصوص من لغات متعددة (ذخيرة متعددة اللغات). الذخائر التي تم تهيئتها خصيصا لمقارنتها جنبا إلى جنب تسمى الذخائر المتوازية.

أنظر أيضا

be:Корпус тэкстаў ca:Corpus lingüístic cs:Jazykový korpus da:Tekstkorpus de:Textkorpus el:Σώμα κειμένων Text corpus]] eo:Korpuso es:Corpus lingüístico eu:Testu corpus fi:Korpus fr:Corpus gl:Corpus lingüístico hi:पाठसंग्रह it:Corpus ja:コーパス ms:Korpus nl:Corpus (taalkunde) pl:Korpus (językoznawstwo) pt:Corpus linguístico sk:Korpus (jazykoveda) sl:Besedilni korpus th:คลังข้อความ zh:语料库 zh-yue:語料庫