Koje je slovo pitanje. Kako sam naučio kucati dodirom

Napisao sam smiješnu PHP skriptu. Provukao sam sve tekstove na Spectatoru da provjerim jezik. Ukupno se u tekstovima koristi 39.110 različitih oblika riječi. Koliko tačno različitih? riječi- prilično teško odrediti. Da bih se barem nekako približio ovoj cifri, uzeo sam samo prvih 5 slova riječi i uporedio ih. Rezultat je bio 14.373 takve kombinacije. Bilo bi preteško nazvati ovo rečnikom „gledatelja“.

Zatim sam uzeo riječi i ispitao ih u pogledu učestalosti ponavljanja slova. U idealnom slučaju, trebate uzeti neku vrstu rječnika, da biste upotpunili sliku. Ne možete pokretati tekstove, potrebne su vam samo jedinstvene riječi. U tekstu se neke riječi ponavljaju češće od drugih. Dakle, dobijeni su sljedeći rezultati:

o - 9,28%
a - 8,66%
e - 8,10%
i - 7,45%
n - 6,35%
t - 6,30%
p - 5,53%
s - 5,45%
l - 4,32%
u - 4,19%
k - 3,47%
n - 3,35%
m - 3,29%
y - 2,90%
d - 2,56%
I - 2,22%
s - 2,11%
b - 1,90%
z - 1,81%
b - 1,51%
g - 1,41%
th - 1,31%
h - 1,27%
yu - 1,03%
x - 0,92%
f - 0,78%
w - 0,77%
c - 0,52%
sch - 0,49%
f - 0,40%
e - 0,17%
ʺ - 0,04%

Savjetujem onima koji idu na “Polje čuda” da zapamte ovu tabelu. I imenujte riječi tim redoslijedom. Tako se, na primjer, čini da se takvo "poznato" slovo "b" koristi rjeđe od "rijetkog" slova "s". Također moramo zapamtiti da riječ ima više od jednog samoglasnika. I da ako ste pogodili jedan samoglasnik, onda morate početi pratiti suglasnike. Osim toga, riječ se pogađa upravo po njenim suglasnicima. Uporedite: “**a**i*e” i “sr*vn*t*”. U oba slučaja riječ je “uporedi”.

I još jedno razmatranje. Kako ste naučili engleski? Sećaš se? E olovka, e olovka, e stol. Ono što vidim je ono o čemu pevam. Šta je poenta?.. Koliko često u normalnom životu izgovarate riječ „olovka“? Ako je zadatak naučiti kako govoriti što je brže i efikasnije moguće, onda morate podučavati u skladu s tim. Analiziramo jezik i izdvajamo najčešće korištene riječi. I počinjemo da učimo od njih. Da biste manje-više govorili engleski, dovoljno je samo hiljadu i po riječi.

Još jedno maženje: formirati riječi od slova nasumično, ali uzimajući u obzir učestalost pojavljivanja, tako da izgleda kao normalne riječi. U prvih deset "slučajnih" riječi od četiri slova pojavilo se "magarac". U narednih pedeset - riječi "jurnjava" i "NATO". Ali, nažalost, ima puno disonantnih kombinacija, poput “bltt” ili “nrro”.

Stoga - sljedeći korak. Podijelio sam sve riječi u kombinacije od dva slova i počeo ih nasumično kombinirati (ali uzimajući u obzir učestalost ponavljanja). Čelik u velikim količinama će proizvesti riječi slične "normalno". Na primjer: “koivdiot”, “voabma”, “apy”, “depoid”, “debyako”, “orfa”, “poesnavy”, “ozza”, “chenya”, “rhetoria”, “urdeed”, “utoichi” , “stikh”, “sapot”, “gravda”, “ababap”, “obarto”, “eleuet”, “lyarezy”, “myni”, “bromomer” pa čak i “todebyst”.

Gdje se prijaviti... postoje opcije. Na primjer, napišite generator prekrasnih markiranih razigranih imena. Za jogurte. Kao, “memoliso” ili “utororerto”. Ili - generator futurističkih pjesama "Burliuk-php": "opeldiy miaton, linoaz okmiaya... deesopen odesson."

I postoji još jedna opcija. Treba probati...

Neke statistike o upotrebi ruskih riječi:

  • Prosječna dužina riječi je 5,28 znakova.
  • Prosječna dužina rečenice je 10,38 riječi.
  • 1000 najčešćih lema pokrivaju 64,0708% teksta.
  • Najčešće leme iz 2000. pokrivaju 71,9521% teksta.
  • 3000 najčešćih lema pokrivaju 76,5104% teksta.
  • 5000 najčešćih lema pokrivaju 82,0604% teksta.

Nakon bilješke dobio sam ovo pismo:


Zdravo Dmitry!

Nakon analize članka „Jezik će te odvesti u Kijev” i dijela u kojem opisuješ svoj program, pojavila se ideja.
Čini mi se da scenario koji ste napisali nije u većoj meri namenjen apsolutno „Polju čuda“, već nečem drugom.
Prva najrazumnija upotreba rezultata vaše skripte je određivanje redosleda slova prilikom programiranja dugmadi za mobilne uređaje. Da, da - sve ovo je potrebno u mobilnim telefonima.

Podijelio sam ga u talasima ()

Slijedi distribucija po dugmadima:
1. Sva slova iz prvog talasa idu na 4 dugmeta u prvom redu
2. Sva slova iz drugog talasa su takođe na preostala 4 dugmeta u istom prvom redu
3. Sva slova iz trećeg talasa idu na preostala dva dugmeta
4. 4,5 i 6 talasa idu u drugi red
5. 7,8,9 talasa ide u treći red, a 9. talas ide u potpunosti (i pored naizgled velikog broja slova) u treći red 9. dugmeta, tako da je 10. dugme ostavljeno za sve vrste interpunkcije oznake (tačka, zarez, itd.).

Mislim da je sve jasno kako jeste, bez detaljnih objašnjenja. Ali ipak, možete li sa svojom skriptom (uključujući znakove interpunkcije) obraditi sljedeće tekstove:

I onda objaviti statistiku? Činilo mi se? da tekstovi što više odražavaju naš savremeni govor, a opet i govorimo i pišemo SMS.

Hvala vam puno unapred.

Dakle, postoje dva načina za analizu učestalosti ponavljanja slova. Metoda 1. Uzmite tekst, pronađite u njemu jedinstvene (neponovljive) oblike riječi i analizirajte ih. Metoda je dobra za izgradnju statistike na osnovu riječi na ruskom jeziku, a ne na tekstovima. Metoda 2. Ne tražite jedinstvene riječi u tekstu, već odmah pređite na brojanje učestalosti ponavljanja slova. Dobijamo učestalost slova u ruskom tekstu, a ne u ruskim riječima. Da biste kreirali tastature i druge stvari, morate koristiti upravo ovu metodu: tekstovi se kucaju na tastaturi.

Tastature bi trebale uzeti u obzir ne samo učestalost slova, već i najupornije riječi (oblike riječi). Nije tako teško pogoditi koje se riječi najčešće koriste: to su, prvo, službeni delovi govora, jer im je uloga da služe uvek i svuda, i zamenice, čija uloga nije ništa manje važna: da zamene bilo koju stvar/osobu u govoru (ovo, on, ona). Pa, glavni glagoli (biti, reći). Na osnovu rezultata analize gore navedenih tekstova, dobio sam sledeće „popularne“ reči: „a, ne, u, ono, on, ja, na, sa, ona, kako, ali, njegov, ovo, da , a, sve, ona, bila, tako, tada, rekla, za, ti, oh, kod, njega, mene, samo, za, mene, da, ti, od, bila, kada, od, za, još uvijek, sada , oni, rekli, već, on, ne, bio, ona, biti, pa, ni, ako, vrlo, ništa, ovdje, sama, tako da, sebi, ovo, možda, ono, prije, mi, oni, da li, bili, je, nego, ili, ona” i tako dalje.

Vraćajući se na tastature, očigledno je da na tastaturi kombinacije slova “ne”, “šta”, “on”, “on” i druge treba da budu što bliže jedna drugoj, ili ako ne bliže, onda u nekom optimalnom način. Potrebno je istražiti kako se tačno prsti kreću po tastaturi, pronaći najudobnije pozicije i u njih postaviti najčešće korištena slova, ne zaboravljajući, međutim, na kombinacije slova.

Problem je, kao i uvek, jedan: čak i ako je moguće napraviti jedinstvenu tastaturu, šta će se dogoditi sa milionima ljudi koji su već navikli na qwerty/ytsuken?

Što se tiče mobilnih uređaja... Vjerovatno ima smisla. U najmanju ruku, slova "o", "a", "e" i "i" moraju biti potpuno na istom ključu. Znakovi interpunkcije prema učestalosti upotrebe: , . - ? ! " ; :) (

Učestalost upotrebe slova u ruskom jeziku

Znate li da se neka slova abecede nalaze u riječima češće od drugih... Štaviše, učestalost upotrebe samoglasnika u jeziku je veća od suglasnika.

Koja slova ruske abecede se najčešće ili najmanje nalaze u riječima koje se koriste za pisanje teksta?

Statistika se bavi identifikacijom i proučavanjem opštih obrazaca. Uz pomoć ovog naučnog smjera, možete odgovoriti na gore postavljeno pitanje prebrojavanjem broja svakog slova ruske abecede, korištenih riječi i odabirom izvoda iz radova različitih autora. Zbog svog interesa i radi nečega što će raditi iz dosade, svako to može sam. Pozvaću se na statistiku već sprovedene studije...

Rusko pismo ćirilica. Tokom svog postojanja, doživio je nekoliko reformi, kao rezultat kojih je formiran moderni ruski alfabetski sistem, uključujući 33 slova.

o — 9,28%
a — 8,66%
e — 8,10%
i - 7,45%
n — 6,35%
t — 6,30%
p — 5,53%
s — 5,45%
l - 4,32%
u — 4,19%
k — 3,47%
n — 3,35%
m — 3,29%
y - 2,90%
d — 2,56%
I - 2,22%
s — 2,11%
b — 1,90%
z — 1,81%
b — 1,51%
g — 1,41%
th — 1,31%
h — 1,27%
yu — 1,03%
x — 0,92%
f — 0,78%
w — 0,77%
c — 0,52%
sch — 0,49%
f — 0,40%
e - 0,17%
ʺ — 0,04%

Rusko slovo sa najvećom učestalošću upotrebe je samoglasnik " O“, kao što je ovdje već ispravno sugerirano. Postoje i tipični primjeri poput „ ODBRANA(7 komada u jednoj riječi i ništa egzotično ili iznenađujuće; vrlo uobičajeno za ruski jezik). Velika popularnost slova "O" uvelike se objašnjava takvim gramatičkim fenomenom kao što je puni samoglasnik. Odnosno, "hladno" umjesto "hladno" i "mraz" umjesto "ološ".

A na samom početku riječi najčešće se nalazi suglasno slovo “ P" Ovo vodstvo je također samouvjereno i bezuvjetno. Najvjerovatnije objašnjenje daje veliki broj prefiksa koji počinju slovom "P": pere-, pre-, pre-, pri-, pro- i drugi.

Učestalost upotrebe slova je osnova kriptoanalize.

Najčešće slovo ruske abecede može se sa sigurnošću nazvati "o". Ne "a", iako sva djeca uče svoje prve riječi sa ovim slovom: "mama", "tata" ili "daj". Ne „i“, iako se može činiti da ga često koristimo kao veznik za povezivanje.

Kako podaci pokazuju, upravo slovo “o” ima učestalost veću od 0,1% u odnosu na druga samoglasnička slova abecede čija je učestalost, na primjer, 0,07-0,08%, što je dosta

Među suglasnicima prvo je slovo “n”.

Takvi podaci se dobijaju analizom učestalosti u NKRJ – Nacionalnom korpusu ruskog jezika, koristeći posebnu formulu. NKRY je elektronska arhiva pisanih i govornih tekstova, koja se sastoji od približno 230 miliona upotrebe riječi.

S obzirom na najpopularnije slovo naše abecede, vrijedi spomenuti zanimljiv fenomen koji se zove "tautogram". Ovo je svojevrsno književno zagrijavanje u kojem trebate sastaviti priču ili pjesmu koja počinje istim slovom. Inače, slovo kojim počinje većina riječi u ruskom jeziku (nemojte ga brkati s učestalošću upotrebe) je „p“, ali među samoglasnicima nesumnjivo vodstvo pripada našem trenutnom favoritu.

"Sam. Veoma. U jesenjoj monotoniji otpali su djelići čari. Olimp je ostao daleki izlaz. Veoma udaljeno. Ostale su ljutnje, ishitrene definicije odmrznutog odmrzavanja, izazvane vatrom dodira. Ostalo se pokazalo negativnim, odbačenim, prevarenim od strane društva. Potomci jeseni posrnu i lete okolo sa ostacima jezerskih očiju. Neki prozori su ostali otvoreni. Gnjevni otisci pojedinačnih homonima zasjenjeni su odbačenim odeždama personifikacije. Narandžaste nijanse morskog trna ocrtane su ogromnim odrazom usamljenosti. Ostalo je okoštavanje, obamrlost propasti. Ostrva su obrasla zavjetima iz eseja o sigurnosti. Hladeći reznice johe formirale su istoimene krugove, zbog promuklih krikova. Zvaničnik se pretvorio u odraz opšteg, ukidajući negativne izvesnosti. Staložene slike ogorčeno su objašnjavale jesenje gluposti, nazivajući suprotno prevarom. Mladi su očajnički ocrtavali začaranu jesen, negirajući objektivan stav... Jesen je letjela kao narandžasti komadići krkavine, ostavljajući umorne rasprave usamljenim odgovorima..."

Smiješno je, zar ne? Ipak to i nije takva glupost :)

Inače, u engleskom je najčešće slovo “e”, a suglasnik je “t”

Pa, i tautogram na engleskom:

Veličanstvena Marija se kreće poput Minerve.

Pravo, latinski, sloboda, učena Lucy voli.

Svako oko vidi Elizinu eleganciju.

Spokojno tihi Suzanini osmjesi iznenađuju.

Od glupana, budala, laskanja, najljepsa Fanny leti.

Pogledajte tipke "F" i "J" na tastaturi i vidjet ćete male tragove. Ovo je naš vodič u svijet kucanja na dodir.

Počevši da proučavam kucanje na dodir, suočio sam se sa osećajem da nešto nije u redu u našem rasporedu. Poenta je bila u neskladu između učestalosti pojavljivanja slova u ruskom jeziku i njihove lokacije na tastaturi.

Šta mislite koje je najčešće pismo u ruskom jeziku? A da ste na „Polju čuda“, koje biste slovo prvo nazvali? Najčešće slovo je "O", a najmanje "F". Ne postoji nijedna izvorna ruska riječ koja počinje slovom "F".

Evo tabele distribucije verovatnoće slova u ruskim tekstovima:

Vjerovatnoća

Vjerovatnoća

Vjerovatnoća

Vjerovatnoća

Slovo "F" nalazi se 45 puta manje od "O", ali zauzima isto zgodno mjesto kao i "O". Ko je osoba koja je usvojila ovaj standard? Odgovor na ovo pitanje naći ćete u članku Tragedija zareza: "...mislite, zarez se nalazi mnogo češće od tačke, a ipak se zarez nalazi velikim slovima. To se ne nalazi ni na jednom jeziku u svijetu osim ruskog...".

Pogledavši tabelu, mogli ste se uvjeriti u sljedeće: da biste kucali naslijepo, možete naučiti lokaciju ne svih slova, već samo, na primjer, 20 - javljaju se u više od 90% slučajeva. Ne vjerujem da osoba koja često kuca ne može zapamtiti lokaciju ključeva i raditi bez da ih pogleda. Sve je stvar navike. Imajte na umu: u svakom servisu gdje je papirologija završena, operateri gledaju u tastaturu, iako vrlo brzo kucaju.

Ali shvatio sam u sastavljanju rasporeda vjerovatnoća je uzeta u obzir. Samo je dizajniran za one... koji kucanje dok gledate na tastaturi!!!

Lako je primijetiti da se sva slova koja se najčešće susreću nalaze u vidnom polju, a ona koja se rjeđe nalaze na periferiji.

Sa engleskim rasporedom situacija je malo gora:

Programi za kucanje dodirom. Ima ih mnogo, možete pogledati recenzije na http://www.urikor.net. Odabrao sam Solo i Stamina. Odlučio sam da počnem sa Solom. Ispostavilo se da je plaćeno, ali demo je bio dostupan. Da završite 1! vježba kucanja potrebna su 2 znaka čitaj više od 10 stranica - svojevrsni "simulator" za brzo čitanje.

I neće vas pustiti dalje dok ne pročitate sve i ispunite standard. Skoro sam se spremao da izbrišem program kada sam dobio pismo sa sajta Solo, gde su bili zainteresovani za moj napredak. Pismo je bilo dugačko, a ja sam pomislio: „Bravo, naučili su da brzo kucaju i da svima pišu duga pisma.“

Ali nakon što sam pažljivo proučio pismo, shvatio sam da ga je napisao robot koji se javlja, iako ga je potpisala osoba. Sada razumijem zašto me je upitnik toliko pitao o mojim interesovanjima i boji kose. Izbrisao sam solo.

I sam sam radio sa programom Stamina. Napravljen je sa dušom! Ne morate čak ni raditi s programom, već ga preuzmite samo za referencu. Ovo je najsmješnija referenca!


Kako sam zapamtio ključeve.
Brzo ćete naučiti "fyva" i "oldzh". Slovo za svaki prst. Ukupno već 8! Učio sam ih ne u Stamine, već u programu sa sajta http://www.urikor.net. A onda sam se sjetio samih pokreta. Na primjer, mnogi ljudi imaju poteškoća sa slovom "i" kada uče kucanje dodirom. Nakon što sam stavio prste na “fyva” i “olj”, da bih pritisnuo tipku “i” potrebno je da potpuno okrenem desni kažiprst.

Sa ovom rotacijom mogu samo pritisnuti tipku "i". Za svaki prst sam zapamtio sljedeće pokrete: “p” - lijevi kažiprst ulijevo, “k” - gore, “e” - gore i desno, itd.

Problemi: budući da raspored nije optimiziran za kucanje dodirom, ispada da su slična slova zrcalna slika jedno drugog, to su tipke “a” i “o”, “k” i “g”. I što je još zanimljivije: date su vježbe za kažiprste istovremeno!, tj. Uče “a” i “o”, “e” i “n”, “p” i “r” u isto vrijeme.

Po mom mišljenju to je tako pogrešno - dolazi do konfuzije u mozgu. Barem se ponekad zbunim. Kada naučite kucati dodirom, razmislite o pokretima - tada je teško ponovo naučiti. Inače, neke žene imaju problem s radom na tastaturi, zbog dugih noktiju pritiskaju druge tipke.

I kada sam sve naučio i odlučio da ću kucati na slepo, došao je sledeći faza - "lijenost". Svaki dan mi je trebalo dosta da kucam i kako je brzina sa zavirivanjem veća, virila sam stalno. Nakon par mjeseci pobijedio sam sebe i zalepio to Svi ključevi su naljepnice sa video kaseta.

Pažnja: Ako ne zalijepite ključeve, navika će vas poraziti. Kada radim na tastaturama na kojima su slova vidljiva, u iskušenju sam da zavirim. Sada nema povratka i ovo je prvi članak napisan potpuno slijepo.

Zašto mi treba. Do sada osećam duboko zadovoljstvo. Brzina je i dalje malo manja nego kod peepinga i još uvijek ima grešaka, ali već dok sam kucao ovaj članak primijetio sam kako se brzina povećava i ponekad se zaboravim, a onda pogledam - ispisano je. Kao da svijest uklanja blokove.

Zanimljivo je gledati kako sami učite, jer takvo iskustvo više nećete imati. Sada planiram da naučim da sviram klavir. Čak mislim da znam da igram(!), samo treba da zapamtim.

P.S.
Prošla je godina. Kucam samo dodirom i velikom brzinom. Ako radite na računaru, obavezno naučite kako kucati dodirom. Lakše je nego što mislite.
Evo jedne male bilješku Inna Igolkina o tome kako je naučila kucati touch-touch.