Михаил Копотев

Введение в корпусную лингвистику

  • ibelyalovhar citeretfor 6 år siden
    исходя из особенностей обработки таких единиц, их можно разделить на три группы:
    1. Контактные неомонимичные обороты
    К этой группе относятся единицы, в которых компоненты непосредственно располагаются друг за другом и однозначно образуют цельную единицу: составные числительные («тридцать три», «33»), единицы типа «потому что», «несмотря на».
    2. Контактные омонимичные обороты
    Эту, самую многочисленную, группу образуют единицы с контактным расположением компонентов, но омонимичные сочетанию двух (или более) слов, связанных синтаксически или даже не имеющих непосредственной синтаксической связи: в общем (ср. в общем вагоне), в прошлом (ср. в прошлом году) и т. д.
    3. Дистантные обороты (англ. skipgrams / concgrams)
    В эту группу входят единицы, компоненты которых располагаются (или могут располагаться) дистантно: читал бы, если … то.
  • Marina Ilyinykhhar citeretfor 8 år siden
    Согласно данным Частотного словаря русского языка, изданного в 1977 году, в сотню самых частых слов входят существительное «товарищ» и прилагательное «советский».
  • ngomeniukhar citeretfor 3 år siden
    примером полного корпуса
  • ngomeniukhar citeretfor 3 år siden
    представительную, или репрезентативную, выборку (англ. representative sampling) — такой объем материала, увеличение которого уже почти никак не повлияет на распределение единиц
  • ngomeniukhar citeretfor 3 år siden
    разметки, или аннотации
  • ngomeniukhar citeretfor 3 år siden
    Необходимость работать с собственным корпусом (англ. DIY-corpus, do-it-yourself corpus) возникает по разным причинам: исследование языка конкретного автора или жанра, собранный в экспедициях собственный материал и т. д.
  • ngomeniukhar citeretfor 3 år siden
    какой степени можно опираться на корпус
  • ngomeniukhar citeretfor 3 år siden
    первом значении более технологична и предполагает совместную работу лингвистов и специалистов по компьютерным технологиям. Это не столько теоретическое направление лингвистики, сколько технология. Корпусная лингвистика во втором значении — дело лингвистов, в том числе и специалистов по статистической обработке языка
  • ngomeniukhar citeretfor 3 år siden
    Корпусная лингвистика — это лингвистика корпусов, то есть собраний текстов
  • ngomeniukhar citeretfor 3 år siden
    Рембрандта «Урок анатомии доктора Тульпа»,
fb2epub
Træk og slip dine filer (ikke mere end 5 ad gangen)