Forklarende kombinatorisk ordbog

En forklarende kombinatorisk ordbog er en form for ensproget ordbog designet til at være en del af en mening-tekst sproglig model af en naturligt sprog. Det er hensigten at være en fuldstændig registrering af leksikon af et bestemt sprog. Som sådan er det identificerer og beskriver, i separate indgange, hver af de sproglige s lexemes og phrasemes. Blandt andet hver indgang indeholder en definition, der inkorporerer en lexeme s semantiske aktanter fuldstændige oplysninger om leksikalsk samtidig forekomst; et omfattende sæt af eksempler. ECD er en produktion ordbog det er, det har til formål at give alle de nødvendige oplysninger til en udenlandsk elev eller robot til at producere perfekt formede ytringer af sproget. Eftersom lexemes og phrasemes af et naturligt sprog nummer i hundreder af tusinder, en komplet ECD, i papirform, ville besætte den plads af en stor encyklopædi. En sådan arbejde har endnu ikke opnået; mens ECDs af russisk og fransk er blevet offentliggjort, hver beskriver mindre end én procent af ordforråd af de respektive sprog.

Den ECD blev foreslået i slutningen af ​​1960'erne af Aleksandr Žolkovskij og Igor Mel'čuk og blev senere videreudviklet af Jurij Apresjan. Tre ECDs er i øjeblikket tilgængelige på tryk, en for russisk, og to til fransk. En ordbog af spanske kollokationer DICE er under udvikling.

Karakteristik af en ECD

En komplet ECD af et sprog ville give en post for hver lexeme, byggeri, eller formsprog et benævnt "Leksikalske Units" i brug i sproget. Poster i ECD er baseret på den semantiske definition af en LU, og hver post indeholder en komplet liste over sine kollokationer og leksikale funktioner samt.

Poster for historisk-relaterede Leksikalske enheder, som er homofoner og deler betydelig semantisk komponent er grupperet i større enheder kaldet "gloser", og derved anerkender flertydighed samtidig med at den særskilte status for de uafhængige pågældende produkter. Den engelske vocable forbedre, for eksempel, omfatter seks Leksikalske enheder, som hver især er tilvejebragt en separat leksikalsk post:

Forbedre, udsagnsord

De leksikografiske tal afspejler grader eller niveauer af semantiske afstand mellem Leksikalske enheder inden for en vocable: romertal markere de semantiske grupperinger højeste niveau, mens arabertal markerer det næsthøjeste niveau, og bogstaver angiver det laveste niveau afstande. De fire lexemes grupperet under IMPROVEI, for eksempel, anses for at være tættere på hinanden end at IMPROVEII eller IMPROVEIII, fordi de betydninger af hver af IMPROVEI.1b og IMPROVEI.2 faktisk omfatter betydningen af ​​IMPROVEI.1a. IMPROVEI.1a og IMPROVEI.1b er endnu mere nært beslægtede, fordi engelsk er der mange par ord specifikt labile eller ambitransitive verber, der er relateret med den semantiske vekslen P ~ 'cause1 til P'.

Indekset og hævet tal knyttet til ord i definitionen henvise til subsenses og homophonous poster for et ord som givet i Longman Dictionary of Contemporary English således "device1" refererer til den første post for enhed i denne ordbog, første subsense.

Struktur af ECD posten

En ECD post for en given Leksikalsk Unit, lad os kalde det "L", er opdelt i tre hovedafsnit eller "zoner":

Den semantiske zone

Den semantiske zone beskriver de semantiske egenskaber af L og består af to sub-zoner:

Den fonologisk / graphematic zone

Den fonologisk / graphematic zone giver alle data om L's fonologiske egenskaber. Her er vi igen finde to sub-zoner:

Samtidig forekomst zone

Samtidig forekomst zone præsenterer alle data om L's kombinatoriske egenskaber. Det er organiseret i fem sub-zoner morfologiske, syntaktiske, leksikalske, stilistiske og pragmatiske.

  0   0
Forrige artikel Pell Grant
Næste artikel Udligningstold

Kommentarer - 0

Ingen kommentar

Tilføj en kommentar

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Tegn tilbage: 3000
captcha