Skelbimas
ì´ ì›¹ì‚¬ì´íŠ¸ì— 환ì˜. ì´ê²ƒì€ 보기 ì›ë³¸ì´ë‹¤
Kokia tai kalba? kinų? japonų?
Iš tikrųjų tai korėjiečių kalba. Tai aptikęs rankiniu būdu būčiau užtrukęs daug laiko. Laimei, radau keletą labai tikslių įrankių, kurie gali tai padaryti automatiškai. Jie visi išvardyti žemiau.
Eksperimentas: Išbandžiau svetaines naudodamas pavyzdinį tekstą (1–2 sakinius su 8 žodžiais) iš šių kalbų: portugalų, rusų, korėjiečių, vietnamiečių, italų, turkų, lenkų, ukrainiečių, azerbaidžaniečių, slovėnų, makedonų, olandų, filipiniečių (tagalogų), graikų, galisų, čekų, baltarusių, suomių, totorių ir norvegų.
Iš viso išbandžiau 20 skirtingų kalbų.
3 įrankiai nežinomos kalbos tekstui aptikti
1. LangId (išlaikė 18 testų iš 20, neišlaikė totorių ir baltarusių)

Privalumai: Apskritai, puikus internetinis įrankis. Ji siūlo pagrindines teksto aptikimo funkcijas ir taip pat turi Twitter ir el. pašto aptikimo robotai, kad rezultatai būtų dar greitesni.
Minusai: Jų variklis yra pagrįstas Google API, bet atrodo, kad jie turi geresnių rezultatų nei toliau aprašytas Google detektorius. Atrodo, kad jie puikiai moka daiktus panaudoti. Man nepatiko, kad jie neturi savo unikalaus algoritmo kalboms aptikti.
2. „Google“ kalbos detektorius [nebėra] (išlaikė 17 testų iš 20, neišlaikė portugalų, taglogų ir baltarusių)

Privalumai: „Google“ turi vieną geriausių pasaulyje API, skirtą kalbos aptikimui. Gerai tai, kad galite pamatyti tikimybę, kad jų rodomas rezultatas bus teisingas. Jie sugebėjo išlaikyti daugumą pavyzdinių testų.
Minusai: Labai nustebau, kad jie neišlaikė portugalų testo. Atrodo, kad jie turi (tikiuosi laikiną) šios kalbos klaidą. Be to, jie tikrai gali padaryti geresnį darbą gerindami puslapio dizainą.
3. Kokia tai kalba (išlaikė 11 testų iš 20, neišlaikė rusų, korėjiečių, ukrainiečių, azerbaidžaniečių, makedoniečių, tagalogų, graikų, galisų ir totorių)

Privalumai: Kai kurios kalbos, pavyzdžiui, pietų slavų (serbų, kroatų, slovėnų) yra gana panašios. Tarkime, jei įvesite tekstą kroatų kalba, ši svetainė jums pasakys, kad tekstas taip pat gali būti serbų arba slovėnų kalba.
Minusai: Jie turi stengtis, kad jų aptikimo sistema būtų sudėtingesnė. Galvojau įdėti Translated.net (kita kalbos aptikimo svetainė) vietoj šios, tačiau „Translated“ pažadėjo aptikti daugiau kalbų ir iš tikrųjų pasirodė blogiau nei WhatLanguageIsThis.com.
2 įrankiai, skirti aptikti svetaines nežinomomis kalbomis
4. Google vertėjas su Aptikti kalbą kaip pirmasis variantas
Išlaikyta: 18 iš 20, nepraleido baltarusių ir totorių.
Privalumai: Šis įrankis puikiai atlieka savo darbą. Man patinkantis dalykas Google vertėjas „Google“ vertėjas 2.1 rodomas su vietine „iOS 7“ klaviatūra ir daugiau kalbų palaikymoAtnaujinkite į „Google“ vertėją 2.1 savo „iOS“ įrenginyje ir naudokitės vertimo bei rašymo ranka įvesties palaikymu naujomis kalbomis. „Google“ vertėjas pagaliau gauna naują „iOS 7“ klaviatūrą, kuri gali atlikti visus... Skaityti daugiau yra tai, kad jei ji nepalaiko konkrečios kalbos, rodomas toks ekranas:

Tai puikus kalbos detektorius, jei manęs klausiate!
5. Microsoft Bing vertėjas su Automatiškai aptikti kaip pirmasis variantas.

Išlaikyta: 8 iš 20, neišlaikė olandų, vietnamiečių, turkų, ukrainiečių, azerbaidžaniečių, slovėnų, makedoniečių, tagalogų, graikų, galisų, čekų ir baltarusių
Privalumai: Jis palaiko ribotą kalbų skaičių. Toms kalboms jis puikiai atlieka savo darbą.
Minusai: Esu labai nusivylęs Microsoft. Jie turi labai ribotą kalbų skaičių aptikti ir vertimas Pamirškite „Google“ vertėją: 3 būdai gauti tikslų ir greitą vertimąNepriklausomai nuo to, ar ketinate kreiptis dėl darbo ar buto užsienyje, ar norite išversti savo tinklalapį, turite susitvarkyti net ir užsienio kalba. Skaityti daugiau ir jų automatinio aptikimo funkcija yra baisi. Jei įvesite kalbą, kurios jie nepalaiko, gausite neteisingą rezultatą, užuot sakę, kad jie tos kalbos nepalaiko.
mintys
Apskritai, mano nuomone, pirmiau minėtos priemonės eina gera linkme. Šiuo metu jie yra geriausi kalboms aptikti internete ir gana gerai atlieka savo darbą, kai kalbama apie populiarias kalbas. Tačiau jie turi dirbti, kad pridėtų daugiau neaiškių kalbų (nė vienas įrankis negalėjo atpažinti totorių), ir aš tikiu, kad visos jos, ypač „Google“, artimiausiu metu eis ta kryptimi.
Vaizdo kreditas: Kanko*
Mano vardas Darko (slapyvardis Darren.) Man patinka Web 2.0, kurti nišines svetaines (mano naujausias projektas yra žmonių paieška) ir taip toliau... ką dar galiu pasakyti apie mane tokiame trumpame profilyje, sekite mano Twitter, jei norite sužinoti daugiau :)