Které písmeno je otázka. Jak jsem se naučil dotykové psaní

Napsal jsem vtipný PHP skript. Projel jsem všechny texty na Spectator, abych zkontroloval jazyk. Celkem je v textech použito 39 110 různých tvarů slov. Kolik přesně různých? slova- docela těžké určit. Abych se k tomuto údaji alespoň nějak přiblížil, vzal jsem pouze prvních 5 písmen slova a porovnal je. Výsledkem bylo 14 373 takových kombinací. Nazvat to slovní zásobou „diváka“ by bylo těžké.

Potom jsem slova vzal a zkoumal je na frekvenci opakování písmen. V ideálním případě si musíte vzít nějaký slovník, abyste obrázek dokončili. Nemůžete spouštět texty, potřebujete pouze jedinečná slova. V textu se některá slova opakují častěji než jiná. Takže byly získány následující výsledky:

o – 9,28 %
a – 8,66 %
e – 8,10 %
a - 7,45 %
n – 6,35 %
t – 6,30 %
p – 5,53 %
s – 5,45 %
l – 4,32 %
v - 4,19 %
k – 3,47 %
n – 3,35 %
m – 3,29 %
y – 2,90 %
d – 2,56 %
já – 2,22 %
s – 2,11 %
b – 1,90 %
z – 1,81 %
b – 1,51 %
g – 1,41 %
čt - 1,31 %
h – 1,27 %
yu – 1,03 %
x – 0,92 %
f – 0,78 %
w – 0,77 %
c – 0,52 %
sch – 0,49 %
f – 0,40 %
e – 0,17 %
ъ - 0,04 %

Doporučuji těm, kteří jdou do „Pole zázraků“, aby si tuto tabulku zapamatovali. A pojmenujte slova v tomto pořadí. Zdá se tedy, že takové „známé“ písmeno „b“ se používá méně často než „vzácné“ písmeno „s“. Musíme si také uvědomit, že slovo má více než jednu samohlásku. A že pokud jste uhodli jednu samohlásku, tak je potřeba začít sledovat souhlásky. A kromě toho, slovo je uhodnuto přesně podle jeho souhlásek. Porovnejte: „**a**i*e“ a „sr*vn*t*“. V obou případech jde o slovo „porovnat“.

A ještě jedna úvaha. Jak ses naučil anglicky? Pamatovat si? E pero, e tužka, e tabulka. To, co vidím, o tom zpívám. Jaký to má smysl?... Jak často v normálním životě říkáte slovo „tužka“? Pokud je úkolem naučit mluvit co nejrychleji a nejefektivněji, pak je třeba podle toho učit. Analyzujeme jazyk a zvýrazníme nejčastěji používaná slova. A my se od nich začneme učit. K víceméně angličtině stačí jen jeden a půl tisíce slov.

Další hýčkání: tvořit slova z písmen náhodně, ale s přihlédnutím k četnosti výskytu, aby to vypadalo jako normální slova. V prvních deseti „náhodných“ čtyřpísmenných slovech se objevil „osel“. V dalších padesáti - slova „spěchání“ a „NATO“. Ale, bohužel, existuje mnoho disonantních kombinací, jako je „bltt“ nebo „nrro“.

Proto - další krok. Všechna slova jsem rozdělil do dvoupísmenných kombinací a začal je náhodně kombinovat (ale s přihlédnutím k frekvenci opakování). Ocel ve velkém množství vytvoří slova podobná „normálnímu“. Například: „koivdiot“, „voabma“, „apy“, „depoid“, „debyako“, „orfa“, „poesnavy“, „ozza“, „chenya“, „rhetoria“, „urdeed“, „utoichi“ , „stikh“, „sapot“, „gravda“, „ababap“, „obarto“, „eleuet“, „lyarezy“, „myni“, „bromomer“ a dokonce „todebyst“.

Kde se přihlásit... jsou možnosti. Napište například generátor krásných značkových hravých jmen. Na jogurty. Například „memoliso“ nebo „utororerto“. Nebo - generátor futuristických básní "Burliuk-php": "opeldiy miaton, linoaz okmiaya... deesopen odesson."

A je tu ještě jedna možnost. Je potřeba vyzkoušet...

Některé statistiky o používání ruských slov:

  • Průměrná délka slova je 5,28 znaků.
  • Průměrná délka věty je 10,38 slova.
  • 1000 nejčastějších lemmat pokrývá 64,0708 % textu.
  • 2000 nejčastějších lemmat pokrývá 71,9521 % textu.
  • 3000 nejčastějších lemmat pokrývá 76,5104 % textu.
  • 5000 nejčastějších lemmat pokrývá 82,0604 % textu.

Po oznámení jsem obdržel tento dopis:


Ahoj Dmitriji!

Po analýze článku „Jazyk vás přivede do Kyjeva“ a části, kde popisujete svůj program, vznikl nápad.
Zdá se mi, že scénář, který jste napsal, není ve větší míře určen pro „Pole zázraků“, ale pro něco jiného.
Prvním nejrozumnějším využitím výsledků vašeho skriptu je určení pořadí písmen při programování tlačítek pro mobilní zařízení. Ano, ano – právě v mobilních telefonech je tohle všechno potřeba.

Rozdělil jsem to ve vlnách ()

Následuje rozdělení podle tlačítek:
1. Všechna písmena z první vlny přejdou na 4 tlačítka v první řadě
2. Všechna písmena z druhé vlny jsou také na zbývajících 4 tlačítkách ve stejné první řadě
3. Všechna písmena ze třetí vlny přejdou na zbývající dvě tlačítka
4. 4,5 a 6 vln jdou do druhé řady
5. 7,8,9 vln jde do třetí řady a 9. vlna jde úplně (i přes zdánlivě velký počet písmen) do třetí řady 9. tlačítka, takže 10. tlačítko je ponecháno pro všechny druhy interpunkce znaménka (tečka, čárka atd.).

Myslím, že vše je jasné tak, jak to je, bez podrobných vysvětlení. Přesto byste mohli pomocí svého skriptu (včetně interpunkčních znamének) zpracovat následující texty:

A pak zveřejnit statistiky? Zdálo se mi to? aby texty co nejvíce odrážely naši moderní řeč, a přesto jak mluvíme, tak píšeme SMS.

Předem moc děkuji.

Existují tedy dva způsoby, jak analyzovat frekvenci opakování písmen. Metoda 1. Vezměte text, najděte v něm jedinečné (neopakující se) tvary slov a analyzujte je. Metoda je dobrá pro vytváření statistik založených na slovech v ruském jazyce, nikoli na textech. Metoda 2. Nehledejte v textu jedinečná slova, ale přejděte rovnou k počítání frekvence opakování písmen. Četnost písmen dostáváme v ruském textu, nikoli v ruských slovech. Chcete-li vytvořit klávesnice a další věci, musíte použít přesně tuto metodu: texty se píší na klávesnici.

Klávesnice by měly brát v úvahu nejen četnost písmen, ale také nejtrvalejší slova (tvary slov). Není tak těžké uhodnout, která slova jsou nejčastěji používaná: jsou to za prvé oficiální slovní druhy, protože jejich úlohou je sloužit vždy a všude, a zájmena, jejichž role je neméně důležitá: nahrazovat v řeči jakoukoli věc/osobu (toto, on, ona). No, hlavní slovesa (být, říkat). Na základě výsledků analýzy výše uvedených textů jsem obdržel tato „populární“ slova: „a ne, v tom, on, já, na, s, ona, jak, ale, jeho, toto, do , a, all, ona, was, so, then, say, for, you, oh, at, him, me, only, for, me, yes, you, from, was, when, from, for, still, now , oni, řekli, už, on, ne, byla, ona, být, no, ani, kdyby, velmi, nic, tady, sama, aby, sobě, to, možná, to, předtím, my, oni, zda, byly, je, než, nebo, ona“ a tak dále.

Vrátíme-li se ke klávesnicím, je zřejmé, že na klávesnici by kombinace písmen „ne“, „co“, „on“, „on“ a další měly být co nejblíže k sobě, nebo pokud ne blízko, tak v nějaké optimální cesta. Je nutné provést průzkum, jak přesně se prsty pohybují po klávesnici, najít „nejpohodlnější“ pozice a umístit do nich nejčastěji používaná písmena, aniž bychom však zapomněli na kombinace písmen.

Problém je jako vždy jeden: i když je možné vytvořit Unique Keyboard, co se stane s miliony lidí, kteří jsou již na qwerty/ytsuken zvyklí?

Co se týče mobilních zařízení... Asi to má smysl. Přinejmenším písmena "o", "a", "e" a "i" musí být přesně na stejné klávese. Interpunkční znaménka v pořadí četnosti používání: , . - ? ! "; :) (

Frekvence používání písmen v ruštině

Víte, že některá písmena abecedy se vyskytují ve slovech častěji než jiná... Navíc frekvence použití samohlásek v jazyce je vyšší než souhlásek.

Která písmena ruské abecedy se nejčastěji nebo nejméně často vyskytují ve slovech používaných k psaní textu?

Statistika se zabývá identifikací a studiem obecných zákonitostí. S pomocí tohoto vědeckého směru můžete odpovědět na výše položenou otázku spočítáním počtu každého písmene ruské abecedy, použitých slov a výběrem úryvku z děl různých autorů. Pro svůj vlastní zájem a pro něco z nudy to zvládne každý sám. Odkážu se na statistiky již provedené studie...

Ruská abeceda azbuka. Během své existence prošel několika reformami, v jejichž důsledku se vytvořil moderní ruský abecední systém obsahující 33 písmen.

o – 9,28 %
a – 8,66 %
e – 8,10 %
a - 7,45 %
n – 6,35 %
t – 6,30 %
p – 5,53 %
s – 5,45 %
l – 4,32 %
v — 4,19 %
k – 3,47 %
n – 3,35 %
m – 3,29 %
y – 2,90 %
d – 2,56 %
já – 2,22 %
s – 2,11 %
b – 1,90 %
z – 1,81 %
b – 1,51 %
g – 1,41 %
čt – 1,31 %
h – 1,27 %
yu – 1,03 %
x – 0,92 %
f – 0,78 %
w – 0,77 %
c – 0,52 %
sch – 0,49 %
f – 0,40 %
e – 0,17 %
ъ – 0,04 %

Ruské písmeno s nejvyšší frekvencí použití je samohláska „ O“, jak zde již bylo správně naznačeno. Existují také typické příklady jako „ OBRANA"(7 kusů jedním slovem a nic exotického nebo překvapivého; velmi běžné pro ruský jazyk). Vysoká popularita písmene „O“ je do značné míry vysvětlena takovým gramatickým jevem, jako je plná samohláska. Tedy „chlad“ místo „zima“ a „mráz“ místo „svinstvo“.

A na samém začátku slov se nejčastěji nachází souhláska „“. P" Toto vedení je také sebevědomé a bezpodmínečné. S největší pravděpodobností vysvětlení poskytuje velké množství předpon začínajících písmenem „P“: pere-, pre-, pre-, pri-, pro- a další.

Frekvence používání dopisů je základem kryptoanalýzy.

Nejběžnější písmeno v ruské abecedě lze bezpečně nazvat „o“. Ne „a“, ačkoli všechny děti se učí svá první slova s ​​tímto písmenem: „máma“, „táta“ nebo „dát“. Ne „a“, i když se může zdát, že je často používáme jako spojovací spojku.

Jak ukazují data, právě písmeno „o“ má četnost přesahující 0,1 % oproti jiným samohláskovým písmenům abecedy, jejichž četnost je například 0,07 – 0,08 %, což je poměrně hodně

Mezi souhláskami je na prvním místě písmeno „n“.

Taková data se získávají analýzou frekvence v NCRY - Národním korpusu ruského jazyka, pomocí speciálního vzorce. NKRY je elektronický archiv psaných a mluvených textů, který se skládá z přibližně 230 milionů slovních použití.

Vzhledem k nejoblíbenějšímu písmenu naší abecedy stojí za zmínku zajímavý fenomén zvaný „tautogram“. Jedná se o druh literární rozcvičky, kdy potřebujete složit příběh nebo báseň začínající stejným písmenem. Mimochodem, písmeno, kterým začíná většina slov v ruském jazyce (nezaměňujte ho s frekvencí používání), je „p“, ale mezi samohláskami patří nepochybné vedení k našemu současnému oblíbenému.

"Sama. Velmi. Střípky půvabu odpadly v podzimní jednotvárnosti. Olympus zůstal vzdáleným odbytištěm. Velmi vzdálené. Zůstaly výčitky, unáhlené definice rozmrazeného tání způsobeného ohněm doteku. Zbytek se ukázal jako negativní, odmítnutý, oklamaný společností. Potomek podzimu klopýtal a poletoval se zbytky jezerních očí. Některá okna zůstala otevřená. Zlostné otisky jednotlivých homonym jsou zastíněny odmítnutými róbami personifikace. Oranžové odstíny rakytníku jsou nastíněny obrovským odrazem osamělosti. Zbytek je osifikace, otupělost zkázy. Ostrovy jsou zarostlé sliby z esejů o jistotě. Chladící olšové řízky vytvořily stejnojmenné kruhy, kvůli chraplavému výkřiku. Úředník se proměnil v odraz generála, rušícího negativní jistoty. Usazené obrazy podrážděně vysvětlovaly podzimní nesmysly a opakovaly klam. Mládež zoufale nastínila kouzelný podzim, popřela objektivní postoj... Podzim létal kolem jako oranžové úlomky rakytníku a nechával unavené spory osamělým odpovědím...“

Je to legrační, že? Není to zase takový nesmysl :)

Mimochodem, v angličtině je nejčastější písmeno „e“. A souhláska je „t“

No a tautogram v angličtině:

Majestátní Mary podobná Minervě se pohybuje.

Právo, latina, svoboda, naučená Lucy miluje.

Elizina elegance každé oko vidí.

Poklidně tiché Susaniny úsměvy překvapí.

Od bláznů, bláznů, lichotek, nejférovější Fanny letí.

Podívejte se na klávesy "F" a "J" na klávesnici a uvidíte malé vodítka. Toto je náš průvodce světem dotykového psaní.

Když jsem začal studovat dotykové psaní, čelil jsem pocitu, že v našem rozložení není něco v pořádku. Šlo o nesoulad mezi četností výskytu písmen v ruském jazyce a jejich umístěním na klávesnici.

Jaké je podle vás nejčastější písmeno v ruštině? A kdybyste byli na „Poli zázraků“, jaké písmeno byste jmenovali jako první? Nejběžnější písmeno je "O" a nejméně obvyklé je "F". Neexistuje jediné původní ruské slovo začínající písmenem „F“.

Zde je tabulka pravděpodobnostního rozložení písmen v ruských textech:

Pravděpodobnost

Pravděpodobnost

Pravděpodobnost

Pravděpodobnost

Písmeno "F" se nachází 45krát méně než "O", ale zaujímá stejné vhodné místo jako "O". Kdo byl ten, kdo přijal tento standard? Odpověď na tuto otázku najdete v článku Tragédie čárky: "... pomyslete, čárka se nachází mnohem častěji než tečka, a přesto se čárka nachází velkými písmeny. To se nenachází v žádném jazyce ve světě kromě ruštiny...".

Při pohledu na tabulku jste se mohli přesvědčit o následujícím: abyste mohli psát naslepo, můžete se naučit umístění ne všech písmen, ale například pouze 20 - vyskytují se ve více než 90% případů. Nevěřím, že člověk, který často píše, si nemůže zapamatovat umístění kláves a pracovat, aniž by se na ně podíval. Všechno je to otázka zvyku. Upozornění: v každé službě, kde se vyřizuje papírování, se operátoři dívají na klávesnici, i když píší velmi rychle.

Ale pochopil jsem to při sestavování layoutu pravděpodobnost byla brána v úvahu. Pouze to bylo navrženo pro ty... kteří psaní při pohledu na klávesnici!!!

Je snadné si všimnout, že všechna nejčastěji se vyskytující písmena jsou umístěna v linii viditelnosti a ta méně často se vyskytující jsou umístěna na periferii.

S anglickým rozložením je situace trochu horší:

Programy pro dotykové psaní. Je jich hodně, na recenze se můžete podívat na http://www.urikor.net. Vybral jsem si Solo a Staminu. Rozhodl jsem se začít se Solo. Ukázalo se, že je placený, ale bylo k dispozici demo. K dokončení 1! cvičení na psaní potřebné 2 znaky číst více než 10 stran - jakýsi „simulátor“ pro rychlé čtení.

A nepustí vás dál, dokud si vše nepřečtete a nesplníte standard. Už jsem se skoro chystal smazat program, když mi přišel dopis z webu Solo, kde se zajímali o můj postup. Dopis byl dlouhý a pomyslel jsem si: „Výborně, naučili se rychle psát a psát dlouhé dopisy všem.“

Ale po pečlivém prostudování dopisu jsem si uvědomil, že jej napsal odpovědný robot, ačkoli byl podepsán osobou. Teď už chápu, proč se mě dotazník tolik ptal na mé zájmy a barvu vlasů. Smazal jsem sólo.

Sám jsem pracoval s programem Stamina. Je vyroben s duší! S programem nemusíte ani pracovat, ale stáhněte si jej pouze pro referenci. Toto je nejvtipnější odkaz!


Jak jsem si vzpomněl na klíče.
Rychle se naučíte „fyva“ a „oldzh“. Písmeno pro každý prst. Celkem již 8! Učil jsem je ne ve Stamine, ale v programu ze stránky http://www.urikor.net. A pak jsem si vzpomněl na samotné pohyby. Mnoho lidí má například potíže s písmenem „i“, když se učí psát dotykem. Když jsem položil prsty na „fyva“ a „olj“, abych mohl stisknout klávesu „i“, musím úplně otočit pravý ukazováček.

S tímto otočením mohu stisknout pouze klávesu "a". Pro každý prst jsem si zapamatoval následující pohyby: „p“ - levý ukazováček doleva, „k“ - nahoru, „e“ - nahoru a doprava atd.

Problémy: protože rozložení není optimalizováno pro dotykové psaní, ukázalo se, že podobná písmena jsou navzájem zrcadlovými obrazy, jedná se o klávesy „a“ ​​a „o“, „k“ a „g“. A co je zajímavější: jsou uvedeny cviky pro ukazováčky zároveň!, tj. Učí „a“ a „o“, „e“ a „n“, „p“ a „r“ současně.

Podle mého názoru je to tak špatně - v mozku dochází ke zmatení. Aspoň jsem někdy zmatená. Když se naučíte psát dotykem, přemýšlejte o pohybech - pak je těžké se znovu naučit. Mimochodem, některé ženy mají problém s prací na klávesnici, kvůli dlouhým nehtům mačkají jiné klávesy.

A když jsem se vše naučil a rozhodl se, že budu psát naslepo, přišla další fáze - "lenost". Každý den jsem potřeboval hodně psát a jelikož je rychlost s pokukováním vyšší, pokukoval jsem pořád. Po pár měsících jsem dobyl sám sebe a zalepil to páskou Všechny klíče jsou nálepky z videokazet.

Pozornost: Pokud si klíče nezalepíte páskou, zvyk vás porazí. Když pracuji na klávesnicích, kde jsou vidět písmena, mám pokušení nakouknout. Nyní už není cesty zpět a toto je první článek napsaný zcela naslepo.

Proč to potřebuji. Zatím cítím pocit hlubokého zadostiučinění. Rychlost je stále o něco menší než při koukání a stále jsou chyby, ale už při psaní tohoto článku jsem si všiml, jak se rychlost zvyšuje a někdy se zapomenu, a pak se podívám - je to vytištěno. Je to, jako by vědomí odstraňovalo bloky.

Je zajímavé sledovat, jak se sami učíte, protože takovou zkušenost už nezažijete. Nyní plánuji naučit se hrát na klavír. Dokonce si myslím, že umím hrát(!), jen si to musím zapamatovat.

P.S.
Uplynul rok. Píšu pouze dotykově a vysokou rychlostí. Pokud pracujete na počítači, určitě se naučte psát dotykem. Je to jednodušší, než si myslíte.
Tady je malý Poznámka Inna Igolkina o tom, jak se naučila psát touch-touch.