Shortcut: WD:Gloss

Wikidata:Data leksikografi/Glosarium

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Lexicographical data/Glossary and the translation is 100% complete.

  • Bentuk (atau Bentukan): Bentuk di sini didefinisikan sebagai realisasi gramatikal dari sebuah Leksem. Bentuk ini dapat berupa infleksi dan deklensi. Sebagai contoh, dalam bahasa Inggris, kata kerja "run" menjadi "running" sebagai bentuk present participle dan "runs" sebagai bentuk orang ketiga tunggal. Peran setiap bentuk dilambangkan dengan fitur gramatikal. Sebuah bentuk adalah sebuah subentitas. Subentitas ini meliputi sebuah ID, sebuah representasi, sebuah daftar fitur gramatikal yang tidak berurutan (dan bisa jadi kosong), serta daftar pernyataan bentuk. Bentuk memiliki ID yang dimulai dengan ID dari Leksem tersebut, diikuti dengan tanda hubung ("-") dan huruf "F", lalu diikuti dengan bilangan asli dalam notasi desimal, seperti L123-F7. Hal ini untuk mencegah adanya bentuk-bentuk yang berbeda pada Leksem yang berbeda.
  • Pernyataan bentuk: Sebuah pernyataan yang mendeskripsikan bentuk atau hubungannya dengan bentuk lain atau butir (mis. IPA, audio pengucapan).
  • Glosa: Definisi bahasa alami dari sebuah makna (lihat gloss (Q1132324)). Glosa adalah sekumpulan pasangan tak terurut yang tidak kosong, yang masing-masing berisi dari pasangan string dan bahasa glosa. Baik seluruh pasangan dan bagian stringnya dapat disebut glosa'. Glosa menampilkan definisi dari sebuah Leksem dalam berbagai bahasa. Sebagai contoh, sebuah kata dalam bahasa Prancis mungkin memiliki glosa dalam bahasa Prancis, selain glosa dalam bahasa Jerman.
  • Bahasa Glosa direpresentasikan sebagai sebuah kode bahasa.
  • Fitur gramatikal: Spesifikasi dari sebuah kondisi atau peran sintaksis di mana sebuah bentuk digunakan. Fitur gramatikal direpresentasikan sebagai kumpulan butir yang tidak terurut (bisa jadi kosong).
  • Bahasa: adalah istilah yang diterapkan secara berbeda di bagian data leksikografis yang berbeda; lihat bahasa glosa and bahasa Leksem.
  • Kode bahasa: Kode yang menetapkan huruf atau angka sebagai pengenal atau pengklasifikasi bahasa (lihat language identifier (Q2092812)). Kode bahasa yang valid dalam data leksikografis sebagian besar merupakan himpunan bagian dari IETF language tag (Q1059900) yang valid (BCP 47) dan superhimpunan dari bahasa label. Kode tersebut mungkin memiliki subtag penggunaan pribadi yang opsional dalam format -x-Q######.
  • Lema: Bentuk kanonis, bentuk kamus, atau bentuk kutipan dari sebuah kata (lihat lemma (Q18514)). Contohnya, "run", "runs", "ran", dan "running" adalah bentuk-bentuk dari Leksem yang sama, dengan "run" sebagai lema. Lema bukanlah string sederhana, melainkan sebuah himpunan pasangan tak terurut yang tidak kosong yang meliputi sebuah string dan varian ejaan. Setiap pasangan atau bagian string dari lema tersebut juga dapat disebut sebagai sebuah lema. Oleh karena itu, sebuah lema dapat mencakup kata-kata dalam beberapa ortografi. Misalnya, lema untuk kata benda bahasa Inggris "color" akan mencakup "colour" untuk bahasa Inggris Britania dan juga "color" untuk bahasa Inggris Amerika.
  • Leksem: Elemen leksikal dari suatu bahasa, seperti kata, frasa, atau imbuhan (lihat lexeme (Q111352)). Terdiri dari sekumpulan bentuk yang diambil dari sebuah kata dalam sebuah bahasa, dan kata-kata dalam berbagai varian ortografinya. Misalnya, kata benda bahasa Inggris "color" dan "colour", serta bentuk jamaknya "colors" dan "colours" dianggap sebagai satu Leksem, sedangkan kata benda bahasa Inggris "color" dan kata kerja "color" adalah dua Leksem yang berbeda. Setiap leksem adalah sebuah entitas yang disimpan di halaman di ruang nama Lexeme:. Sebuah Leksem mencakup sebuah id dengan awalan (seperti L123), sebuah lema, sebuah bahasa leksem, sebuah kelas kata (kategori leksikal), sebuah daftar pernyataan leksem, sebuah daftar bentuk, dan sebuah daftar makna.
  • Bahasa leksem: Sebuah bahasa yang menjadi asal sebuah Leksem. Ditandai dengan sebuah butir.
  • Pernyataan leksem: Sebuah pernyataan yang tidak spesifik untuk suatu Bentuk atau Makna (misalnya berasal dari gender gramatikal atau fungsi sintaksis)
  • Kelas kata (atau Kategori leksikal): Klasifikasi leksem ke dalam kategori yang memiliki sifat tata bahasa yang serupa (lihat part of speech (Q82042)), juga dikenal sebagai kelas kata pada tata bahasa. Kelas kata dilambangkan dengan butir, misalnya noun (Q1084) dan verb (Q24905).
  • Representasi: Teks dari sebuah bentuk. Seperti lema, representasi bukanlah string sederhana, tetapi merupakan sebuah set pasangan string/varian ejaan yang tidak terurut dan tidak kosong. Setiap pasangan atau bagian string dari sebuah representasi juga bisa disebut sebagai representasi.
  • Makna: Arti dari leksem yang diwakilinya dalam sebuah teks. Sebuah Leksem bisa saja memiliki lebih dari satu makna, meski demikian, setiap Leksem harus memiliki setidaknya satu makna. Suatu makna adalah sebuah subentitas. Sebuah makna mencakup sebuah ID, sebuah glosa, dan sebuah daftar pernyataan makna. Makna memiliki ID yang dimulai dengan ID dari Leksem asalnya, diikuti dengan tanda hubung ("-") dan "S", diikuti dengan bilangan asli dalam notasi desimal: contohnya L123-S4.
  • Pernyataan makna: Sebuah pernyataan yang menjelaskan makna dan hubungannya dengan makna lain atau butir (mis. terjemahan, sinonim, antonim, konotasi).
  • Varian ejaan: Varian ejaan adalah ortografi spesifik dari sebuah lema atau representasi. Contoh varian ejaan adalah bahasa Inggris Britania (en-gb) dan bahasa Inggris Amerika (en-us) yang dianggap sebagai varian ejaan yang berbeda. Varian ejaan direpresentasikan sebagai sebuah kode bahasa.
  • Subentitas: Sebuah bentuk atau makna. Subentitas adalah jenis khusus dari entitas dan dapat digunakan dalam pernyataan, tetapi subentitas tidak memiliki halaman sendiri. Sebaliknya, semua informasi dari sebuah subentitas disimpan di halaman Leksem tempat subentitas tersebut berada. Setiap subentitas bergantung pada satu Leksem.