Shortcut: WD:Gloss

Wikidata:Sözlükbirimsel veriler/Terimler

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Lexicographical data/Glossary and the translation is 6% complete.
Outdated translations are marked like this.

  • Form, Lexeme'lerin gramer kurallarına göre kullanılma biçimleridir. Bunlar, çekimleri ve ekleri de içeriyor. Mesela, İngilizce'deki "run" fiili, geniş zaman çekimiyle "running", 3. şahıs ekiyle "runs" oluyor. (Türkçe'de benzer bir örnek, "koşmak", emir kipiyle "koş", duyulan geçmiş zaman kipiyle 3. kişi çekimi olarak "koştu" oluyor.) Formların gramer özellikleri ayrıca belirtiliyor. Formlar altögelerdir, kendi ID'leri, gösterimleri vardır, sırasız (boş olma ihtimali de olan) bir gramer özellikleri listesi vardır. Formların ID'leri, ait oldukları Lexeme'lerin ID'leriyle başlar, sonrasında bir tire ("-") vardır, sonrasında F, ve en sonda da rakamlar vardır. L123-F7 gibi. Bu, formların başka Lexeme'lerle karışmasını engeller.
  • Form açıklaması, Vikiveri'deki formları tanımlayan veya başka ögelere bağlantısını gösteren açıklamalardır. (IPA gösterimi, telaffuz ses dosyası gibi).
  • Sözlük girdisi (geniş anlamıyla) anlamların (bkz. gloss (Q1132324)) doğal tanımlarıdır. Sözlük girdileri boş olmayan ve sırasız bir string/sözlük girdi dili ikilisi setidir, bu ikililer veya string kısmı (dar anlamıyla) Sözlük girdisi olarak tanımlanabilir. Bu girdiler, anlamları farklı dillerde verir. Mesela, Fransızca bir kelimenin hem Almanca hem Fransızca sözlük girdileri olabilir.
  • Girdi Dili veya Girdinin Dili dil kodu kullanılarak temsil edilir.
  • Gramer özellikleri, bir formun hangi koşullar altında veya hangi dilbilimsel rolde kullanıldığını belirler. Bunlar sırasız (boş olabilen) bir öge seti olarak temsil edilir.
  • Dil, sözlükbirimsel verinin farklı yerlerinde farklı anlamda kullanılabilir; bkz. girdi dili ve sözlükbirim dili.
  • Language code: A code that assigns letters or numbers as identifiers or classifiers for languages (see language identifier (Q2092812)). The valid language codes in lexicographical data are mostly a subset of valid (BCP 47) IETF language tag (Q1059900) and a superset of label languages. It may have an optional private-use subtag in format -x-Q######.
  • Lemma: The canonical, dictionary, or citation form of a word (see lemma (Q18514)). For example, "run", "runs", "ran", and "running" are forms of the same lexeme, with "run" as the lemma. Lemmas are not simple strings, but a non-empty unordered set of pairs that include a string and a spelling variant. Each of the pairs or the string parts thereof may also be called a lemma. Therefore, a lemma can include words in multiple orthographies. For example, the lemma for the English noun "color" would include "colour" for British English as well as "color" for American English.
  • Lexeme: A lexical element of a language, such as a word, a phrase, or a affix (see lexeme (Q111352)). It consists of a set of forms taken by a single word in one language, and words in any variant orthographies thereof. For example, the English nouns "color" and "colour" and their plural forms "colors" and "colours" are considered as one lexeme, while English noun "color" and verb "color" are two lexemes. Every lexeme is an entity and is stored in a page in the Lexeme: namespace. A lexeme includes a prefixed id (like L123), a lemma, a lexeme language, a lexical category, a list of lexeme statements, a list of forms, and a list of senses.
  • Lexeme language or Language of Lexeme: The language to which a lexeme belongs. Denoted by an item.
  • Lexeme statement: A statement not specific to a Form or Sense (e.g. derived from grammatical gender or syntactic function)
  • Lexical category: A classification of lexemes into categories which have similar grammatical properties (see part of speech (Q82042)), also known as part of speech in grammar. It is denoted by an item, e.g. noun (Q1084) and verb (Q24905).
  • Representation: The text of a form. Like lemmas, representations are not simple strings, but a non-empty unordered set of string/spelling variant pairs. Each of the pairs or the string part thereof may also be called a representation.
  • Sense: A meaning of a lexeme which it may represent in a text. Any number of senses may be defined, although every lexeme should have at least one. A sense is a subentity. It includes an ID, a gloss and a list of sense statements. Senses have IDs starting with the ID of the lexeme they belong to, followed by a hyphen ("-") and an "S", followed by a natural number in decimal notation: e.g. L123-S4.
  • Sense statement: A statement describing the sense and its relations to senses and items (e.g. translation, synonym, antonym, connotation).
  • Farklı yazımlar bir lemmanın veya temsilin spesifik bir yazım şeklidir, mesela Britanya İngilizcesi (en-gb) ve Amerikan İngilizcesi (en-us) farklı yazımlardır. Bu farklı yazımlar dil kodlarıyla gösterilir.
  • Subentity: A form or a sense. They are a special kind of entity and may be used in statements, but they do not have their own pages. Instead, all the information of a subentity is stored in the page of the lexeme that a subentity belongs to. Each subentity functionally depends on a single lexeme.