Automatisk Sprog Oversætter

IBMs Ac Oversætter var en maskinoversættelsessystem, der konverterede russiske dokumenter til engelsk. Den Translator bruges en optisk disk, opbevaret 170.000 ord for ord og sætning-for-redegørelse oversættelser og en brugerdefineret computer til em up ved høj hastighed. Bygget til US Air Force Foreign Technology Division, AN / GSQ-16, som det blev kendt af Air Force, blev primært brugt til at konvertere sovjetiske tekniske dokumenter til distribution til vestlige forskere. Oversætteren blev installeret i 1959, dramatisk opgraderet i 1964, og til sidst blev erstattet af en mainframe kører SYSTRAN i 1970.

Historie

Photoscopic butik

Oversætteren kan føre sin historie til en juni 1953 kontrakt fra den amerikanske flåde til den internationale Telemeter Corporation i Los Angeles. Dette var ikke en oversættelse system, men en ren forskning og udvikling kontrakt for en højtydende fotografisk online lagermedium, der består af små sorte rektangler indlejret i en plastik disk. Når den oprindelige kontrakt løb ud, det daværende Rom-Air Development Center tog yderligere finansiering i 1954 og fremefter.

Systemet er udviklet af Gilbert konge, chef for teknik på ITC, sammen med et hold, der omfattede Louis Ridenour. Det udviklede sig til en 16 tommer plastskive med data registreret som en række af mikroskopiske sorte rektangler eller klare pletter. Kun de yderste 4 inches af disken blev brugt til opbevaring, hvilket forøgede lineære hastighed af delen anvendes. Når disken centrifugeret ved 2.400 RPM det havde en adgang hastighed på ca. 1 Mbit / sek. I alt det system lagret 30 Mbit, hvilket gør det den højeste tæthed online system af sin æra.

Mark I

I 1954 IBM gav en indflydelsesrig demonstration af maskinoversættelse, i dag kendt som "Georgetown-IBM-eksperimentet". Kør på en IBM 704 mainframe, oversættelsen systemet vidste kun 250 ord af russisk begrænset til området for organisk kemi, og kun 6 grammatik regler for at kombinere dem. Ikke desto mindre var resultaterne meget lovende, og meget omtalt i pressen.

På det tidspunkt, de fleste forskere i den spirende maskinoversættelse felt mente, at den store udfordring at levere fornuftige oversættelser byggede et stort bibliotek, som lagringsenheder i den æra var både for lille og for langsom til at være nyttig i denne rolle. Kongen mente, at den photoscopic butikken var en naturlig løsning på problemet, og slog tanken om et automatiseret oversættelse system baseret på photostore til flyvevåbnet. RADC viste sig interesseret, og forudsat en forskningsbevilling maj 1956. På det tidspunkt, flyvevåbnet også et tilskud til forskere på University of Washington, der arbejdede på problemet med at producere en optimal oversættelse ordbog for projektet.

Kongen gik ind for et enkelt ord for ord tilgang til oversættelser. Han mente, at de naturlige afskedigelser i sproget ville tillade endnu en dårlig oversættelse at blive forstået, og at lokale kontekst var alene nok til at give rimelige gæt, når de står med tvetydige vendinger. Han erklærede, at "succes mennesket i at opnå en sandsynlighed of.50 foregribe ordene i en sætning skyldes i høj grad hans erfaring og de reelle betydninger af ordene allerede opdaget." Med andre ord ville simpelthen at oversætte ord alene tillader et menneske til effektivt at læse et dokument, fordi de ville være i stand til at ræsonnere den egentlige betydning fra konteksten, som tidligere ord.

I 1958 flyttede kongen til IBMs Thomas J. Watson Research Center, og fortsatte udvikling af photostore-baserede oversætter. Over tid, kong ændret tilgang fra en ren ord for ord oversætter til en, der er gemt "stilke og endelser", der brød ord til dele, der kunne kombineres sammen igen til at danne komplette ord igen.

Den første maskine, "Mark I", blev påvist i juli 1959 og bestod af en 65.000 ord ordbog og en brugerdefineret rør-baseret computer til at gøre de opslag. Tekster blev hånd-kopieret over på hulkort hjælp brugerdefinerede kyrilliske terminaler, og derefter input i maskinen til oversættelse. Resultaterne var mindre end imponerende, men var nok til at foreslå, at en større og hurtigere maskine ville være en fornuftig udvikling. I mellemtiden blev den Mark I anvendt på oversættelser af den sovjetiske avis Pravda. Resultaterne fortsatte med at være tvivlsom, men kongen erklærede det en succes, idet den i Scientific American, at systemet var "... fundet i en operationel evaluering, at være ganske nyttigt af regeringen."

Mark II

Den 4. oktober 1957 Sovjetunionen lancerede Sputnik 1, første kunstige satellit. Dette forårsagede en bølge af bekymring i USA, hvis eget projekt Vanguard blev fanget flat-footed og derefter viste sig at gentagne gange mislykkes i spektakulær vis. Denne pinlige vending i begivenhederne førte til en enorm investering i amerikansk videnskab og teknologi, herunder dannelsen af ​​DARPA, NASA og en bred vifte af intelligens indsats, der ville forsøge at undgå at blive overrasket på denne måde igen.

Efter en kort periode, efterretningstjenesterne indsatsen centraliseret på Wright Patterson Air Force Base som udenlandsk teknologi division, der drives af Air Force med input fra DIA og andre organisationer. FTD fik til opgave at oversættelsen af ​​Sovjet og andre Warszawa Bloc tekniske og videnskabelige tidsskrifter, så forskere i "vest" kunne holde sig orienteret om udviklingen bag jerntæppet. De fleste af disse dokumenter var offentligt tilgængelige, men FTD gjorde også en række enkeltstående oversættelser af andre materialer efter anmodning.

Forudsat der var en mangel på kvalificerede oversættere, FTD blev meget interesseret i kongens bestræbelser på IBM. Midler til en opgraderet maskine var snart forestående, og arbejdet begyndte på en "Mark II" system baseret omkring en transistoriserede computer med en hurtigere og højere kapacitet 10 tommer glas-baserede optisk disk spinning på 2.400 RPM. En anden tilføjelse var en optisk karakter læser leveres af tredjepart, som de håbede ville eliminere tidskrævende proces med at kopiere den russiske tekst i maskinlæsbare kort.

I 1960 Washington holdet sluttede også IBM, hvilket bringer deres ordbog indsats med dem. Ordbogen fortsatte med at ekspandere som ekstra lagerplads blev stillet til rådighed, nåede 170.000 ord og udtryk, som den tid, det blev installeret på FTD. En større softwareopdatering blev også indarbejdet i Mark II, som kong benævnt "ordbog fyld". Stopning var et forsøg på at håndtere problemerne med tvetydige ord ved "fyld" præfikser på dem fra tidligere ord i teksten. Disse modificerede ord ville matche med tilsvarende fyldte ord i ordbogen, hvilket gør kampene mere unik.

I 1962 Kongen forlod IBM for Itek, en militær entreprenør i gang med hurtigt at erhverve nye teknologier. Udvikling hos IBM fortsatte, og systemet gik fuldt operationelt på FTD i februar 1964. Systemet blev demonstreret på 1964 New York verdensudstilling. Versionen på messen omfattede en 150.000 ord ordbog, med omkring 1/3 af ordene i sætninger. Omkring 3.500 af disse blev opbevaret i core hukommelse for at forbedre ydeevnen, og en gennemsnitlig hastighed på 20 ord i minuttet blev hævdet. Resultaterne af omhyggeligt udvalgte tekstinput var ret imponerende. Efter sin tilbagevenden til den FTD, blev det brugt kontinuerligt indtil 1970, hvor den blev erstattet af en maskine, der kører SYSTRAN.

ALPAC Rapport

I 1964 det amerikanske forsvarsministerium bestilt i USA National Academy of Sciences at udarbejde en rapport om status for maskinoversættelse. NAS dannede "Automatic Language Processing rådgivende udvalg", eller ALPAC, og offentliggjort deres resultater i 1966. Rapporten, Sprog og Maskiner: Computere i Oversættelse og Sprogvidenskab, var meget kritisk over de eksisterende indsats, der viser, at systemerne var ikke hurtigere end menneskelige oversættelser, også mens der viser, at den formodede manglende oversættere i virkeligheden var et overskud, og som et resultat af udbud og efterspørgsel spørgsmål, menneskelig oversættelse var forholdsvis billig omkring $ 6 pr 1.000 ord. Værre, FTD var langsommere samt; forsøg med fysik papirer som input viste, at Oversætter var "10 procent mindre præcis, 21 procent langsommere, og havde en forståelse niveau 29 procent lavere, end når han brugte menneskelig oversættelse."

Rapporten ALPAC var så indflydelsesrig som Georgetown eksperimentet havde været et årti tidligere; umiddelbart efter offentliggørelsen, den amerikanske regering suspenderede næsten alle midler til maskinoversættelse forskning. Igangværende arbejde hos IBM og IDEK var endt med 1966 forlader banen til europæerne, der fortsatte udvikling af systemer som SYSTRAN og Logos.

  0   0
Forrige artikel Carolyn Cole
Næste artikel Arkhangelskoye Palace

Relaterede Artikler

Kommentarer - 0

Ingen kommentar

Tilføj en kommentar

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Tegn tilbage: 3000
captcha