Akviziční korpusy češtiny

Akviziční korpusy zaznamenávají užívání konkrétního jazyka mluvčími, kteří si ho (dosud) neosvojili na úrovni dospělého rodilého mluvčího. Poskytují tak informace o osvojování neboli akvizici daného jazyka.​ Akviziční korpusy nacházejí bohaté uplatnění v základním výzkumu osvojování jazyka, ale i při aplikaci ve vyučovací nebo terapeutické praxi.

Korpusy sdružené v síti AKCES zachycují produkci mluvčích češtiny, která je pro ně jejich prvním, druhým nebo cizím jazykem. Síť se může v budoucnu rozšířit i o korpusy orientované na češtinu jako jazyk zděděný. Konkrétní kontext osvojování češtiny v jednolivých korpusech může být velmi různorodý.

Abecedně řazený seznam korpusů naleznete níže.


CzeSL-SGT

písemné texty

druhý/cizí jazyk

školní děti a dospělí

multilingvní

Písemné práce nerodilých mluvčích od školního věku do dospělosti z kurzů češtiny jako cizího jazyka na všech úrovních podle Evropského referenčního rámce.

Korpus je inovovanou verzí předchozího korpusu CzeSL-plain (ciz) – je větší a jeho součástí je automatická morfologická a chybová anotace. Ve verzi CzeSL-man je menší část těchto dat anotovaná manuálně.

Citujte databázi CzeSL-SGT

Šebesta, K., Bedřichová, Z., Šormová, K., Štindlová, B., Hrdlička, M., Hrdličková, T., Hana, J., Petkevič, V., Jelínek, T., Škodová, S., Poláčková, M., Janeš, P., Lundáková, K., Skoumalová, H., Sládek, Š., Pierscieniak, P., Toufarová, D., Richter, M., Straka, M., Rosen, A.: CzeSL-SGT: korpus češtiny nerodilých mluvčích s automaticky provedenou anotací, verze 2 z 28. 7. 2014. Ústav Českého národního korpusu FF UK, Praha 2014. Dostupný z: http://www.korpus.cz

Zjistěte více o CzeSL-SGT

Citujte databázi CzeSL-man

Bedřichová, Z. – Hana, J. – Hrdlička, M. – Hrdličková, T. – Janeš, P. – Jelínek, T. – Lundáková, K. – Petkevič, V. – Pierscieniak, P. – Poláčková, M. – Rosen, A. – Skoumalová, H. – Sládek, Š. – Šebesta, K. – Škodová, S. – Šormová, K. – Štindlová, B. – Toufarová, D. : CzeSL-man: korpus češtiny nerodilých mluvčích s ruční chybovou anotací podle zjednodušeného chybového schématu, verze v1 searchable z 18. 11. 2020. Ústav Českého národního korpusu FF UK, Praha 2020. Dostupný z WWW: http://www.korpus.cz

Zjistěte více o CzeSL-man

CHROMA

nahrávky a přepisy

první jazyk

malé děti

monolingvní

Přepisy mluvené komunikace dětí s rodiči v rodinném prostředí. Zahrnuje 7 dětí přibližně
od 19 do 45 měsíců v mnoha časových bodech po jeden až dva roky.

Citujte odborný článek

Chromá, A., Sláma, J., Matiasovitsová, K., & Treichelová, J. (2024). A morphologically annotated longitudinal corpus of spoken Czech child-adult interactions. Language Resources and Evaluation. https://doi.org/10.1007/s10579-023-09710-y

Zjistěte více

CHROMAT

nahrávky a přepisy

první jazyk

malé děti

monolingvní

Korpus je v procesu vzniku. Pravděpodobná publikace v roce 2025.

Zjistěte více

LABELS2018

nahrávky a přepisy

první jazyk

malé děti

monolingvní

Přepisy mluvené komunikace dětí s rodiči v herně laboratoře LABELS. Zahrnuje 109 dětí ve dvou časových bodech s odstupem jednoho roku.

Citujte odborný článek

Matiasovitsová, K., Čechová, P., Sláma, J., Homolková, K., & Smolík, F. (2024). Mean length of utterance in Czech toddlers: Validity estimates and comparison of words, morphemes, and syllables. Journal of Speech, Language, and Hearing Research, 67(3), 837-852.

Zjistěte více

ROMi mluvené

nahrávky a přepisy

první jazyk

druhý/cizí jazyk

školní děti

monolingvní

multilingvní


Kolekce 110 mluvených rozhovorů dospělých mluvčích češtiny s 1 až 2 dětmi s romským vývojovým pozadím. Zahrnuje romský etnolekt češtiny a vliv sociálně vyloučeného prostředí.

Citujte databázi

Šebesta, K., Bedřichová, Z., Šormová, K., Straňák, P., & Peterek, N. (2014). ROMi 1.0. LINDAT/CLARIAH-CZ digital library at the Institute of Formal and Applied Linguistics (ÚFAL), Faculty of Mathematics and Physics, Charles University. Dostupný z: http://hdl.handle.net/11234/1-160.

Zjistěte více

ROMi písemky

písemné texty

první jazyk

druhý/cizí jazyk

školní děti

monolingvní

multilingvní

Písemné práce dětí s romským vývojovým pozadím z českých škol. Zahrnuje romský etnolekt češtiny a vliv sociálně vyloučeného prostředí.

Korpus byl publikován jako součást nadřazeného korpusu CzeSL-plain. Pomocí „restrict search“ ve vyhledávači Kontext ČNK (návod) je možné omezit hledání pouze na ROMi.

Citujte databázi

Šebesta, K, Bedřichová, Z., Hana, J., Hlaváčková, E., Hnátková, M., Hrdlička, M., Janeš, P., Jelínek, T., Křen, M., Lábus, V., Lundáková, K., Petkevič, V., Pierscieniak, P., Procházka, P., Rosen, A., Skoumalová, H., Škodová, S., Šormová, K. & Štindlová, B. CZESL-PLAIN: akviziční korpus psané češtiny, zvl. přepisů písemných projevů nerodilých mluvčích, verze 2 z 22. 1. 2014. Ústav Českého národního korpusu FF UK, Praha 2012. Dostupný z: http://www.korpus.cz.

Zjistěte více

SCHOLA2010

nahrávky a přepisy

první jazyk

druhý/cizí jazyk

školní děti

monolingvní

multilingvní

Přepisy mluvené komunikace dětí a jejich učitelů ve školních vyučovacích hodinách různých předmětů českých škol od 1. třídy do konce střední školy.

Citujte databázi

Šebesta, K., Goláňová, H., Křen, M., Procházka, P.: SCHOLA2010: korpus mluvené češtiny ve škole – přepisy nahrávek vyučovacích hodin na českých základních a středních školách. Ústav Českého národního korpusu FF UK, Praha 2010. Dostupný z: http://www.korpus.cz

Zjistěte více

SKRIPT2012

písemné texty

první jazyk

druhý/cizí jazyk

školní děti

monolingvní

multilingvní

Slohové písemné práce dětí z českých škol od 5. třídy do konce střední školy. Zahrnuje práce na určené i volné téma v různých žánrech.

Citujte databázi

Šebesta, K., Goláňová, H., Jelínek, T., Jelínková, B., Křen, M., Letafková, J., Procházka, P. & Skoumalová, H. SKRIPT2012: akviziční korpus psané češtiny – přepisy písemných prací žáků základních a středních škol v ČR. Ústav Českého národního korpusu FF UK, Praha 2013. Dostupný z: http://www.korpus.cz

Zjistěte více