2024-04-11

0210 Eblas instrui lingvon al roboto. Kiel maloftaj lingvoj povus profiti?

 La Kalamanga estas lingvo de Okcidenta Nov-Gvineo kun malpli ol 200 parolantoj. Estas preskaŭ nenio en ĝi en la interreto, krom gramatiklibro kaj vortaro/frazaro angla-kalamanga.

Gemini 1.5 Pro estas lingva modelo (artefarita intelekto). Esence, ĝi estas la ChatGPT de Google. Sed granda diferenco kun ChatGPT estas ke Gemini 1.5 Pro havas tre grandan "kuntekstan spacon", tio signifas ke oni povas doni multe pli da informoj al la roboto por helpi la roboton doni ĝustan respondon.

La uzebla kunteksta spaco de Gemini 1.5 Pro estas 1 miliono da ĵetonoj, kio estas pli ol 700 000 vortoj. (Sed Google havas ankaŭ version kiu subtenas 10 milionoj, sed tio estas en la tago de hodiaŭ nur por scienca esplorado).

Google anoncis ke ili instruis la Kalamangan al Gemini 1.5 Pro. Ili sukcesis je tio per doni la gramatiklibron, vortaron kaj frazaron al la kunteksta spaco. Laŭ Google, la kvalito de la traduko de Gemini de teksto de la Angla al Kalamanga estas simila al la kvalito de la laboro de homa tradukisto kiu trejniĝis per la samaj materialoj. (Kio ne nepre signifas ke la kvalito estas bona.)

Estus interese fari la eksperimenton denove per pli da materialoj (kiam ili ekzistos, aŭ per alia lingvo), por vidi ĉu la rezulto estas lingve simila al tio de denaskaj parolantoj.

Se tio bone funkcias, la roboto povas esti bona ilo por praktiki lingvon kiam ne eblas trovi homan alternativon.

Mi pensas ke tio povas esti interesa metodo por konservi maloftajn lingvojn: instrui robotojn, kiuj siavice povas interagi per la lingvo. La denaskaj parolantoj povas paroli al tiuj robotoj. Kiam la robotoj faras eraron, la denaskaj parolantoj korektas (ĉiuj korektoj estus aldonitaj al komuna dosiero en la kunteksta spaco). La robotoj mem "eltrovos" la gramatikon post sufiĉe da komunikado. Tiu maniero konservi lingvon ŝajnas al mi multe pli realisma ol peti normalulojn skribi gramatikajn librojn aŭ vortarojn.

Mi ankaŭ vidas multe da utileco por la disvolviĝo de planlingvoj: per provi instrui planlingvon al roboto, oni povas facile vidi kie mankas detaloj en la gramatiko aŭ en vortaroj (per la eraroj kaj la duboj de la roboto). Kaj kiam la roboto kapablas doni sufiĉe bonajn rezultojn en la planlingvoj, eblas aŭtomatigi grandan parton de la kreado de enhavo (kompreneble oni ĉiam provlegu). Manko je enhavo estas laŭ mi la ĉefa kialo kial planlingvoj ne populariĝas.

https://twitter.com/jeffdean/status/1758149033473020081

https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024/