Методология коммуникативных исследований в лингвистике - стр. 9
Бесценным источником материала для современных исследователей являются корпусные данные. Корпус лингвистический – это собрание текстов в электронном виде, сопровожденное разметкой34. Лингвистический корпус отличается от электронной библиотеки тем, что собранные в нем тексты предназначены не для того, чтобы их читать, а для того, чтобы их изучать. Кроме того, тексты в корпусе специальным образом проанализированы – аннотированы или размечены, что позволяет осуществлять поиск по лингвистическим параметрам. В табл. 4 представлены наиболее крупные языковые корпусы, доступ к которым бесплатен или условно бесплатен (при каждом входе можно получить ограниченное количество данных, но входить можно бесчисленное количество раз, или можно получить пробный доступ после регистрации, так называемый trial, на несколько недель или месяцев).
Таблица 4
Наиболее крупные лингвистические корпусы с бесплатным или условно бесплатным доступом
Преимущество корпусных данных состоит в том, что исследователь может задать параметр поиска (определенную словоформу или грамматическое значение, лексему с определенным количеством слов, составляющих ее левый и правый контекст, и т. д.) и достаточно быстро набрать материал в большом объеме. Корпусные данные используются как самостоятельный материал либо привлекаются для проверки выводов, полученных на более узком материале, собранном самим автором.
Экспериментальные данные обычно необходимы для исследований по психолингвистике, психосемантике, социолингвистике, когнитивной лингвистике. Иначе говоря, это данные, которые были получены в экспериментальной работе с информантами (респондентами, испытуемыми). Эксперименты могут быть построены на использовании специальной аппаратуры и соответствующего компьютерного обеспечения либо на постановке перед испытуемыми конкретных задач в непосредственной устной коммуникации.
Устные дискурсы являются интересным и востребованным материалом для работ по дискурс-анализу, социолингвистике, теории коммуникации. При работе с таким материалом могут обнаружиться следующие трудности: 1) для того чтобы начать вести аудио- или видеозапись речи одного человека или группы людей, необходимо предупредить их об этом и получить их устное согласие; если запись ведется в общественном месте (суд, школа и т.д), необходимо письменное разрешение официального должностного лица на проведение таких записей; 2) записи устной речи, сделанные на любом звукозаписывающем устройстве, должны подвергнуться процедуре транскрибирования, для того чтобы устную речь можно было просматривать в письменном виде; существуют общепринятые правила и системы транскрибирования; 3) чтобы опубликовать транскрипты, тоже нужно разрешение тех, кого вы записывали.
Относительно объема анализируемых данных (объема выборки) известная исследовательница разговорного дискурса Дебора Кэмерон высказалась так: «Сколько данных достаточно? Это вопрос, с которым сталкивается каждый исследователь, и простой, хоть и бесполезный, ответ на него – «смотря по обстоятельствам». А обстоятельства – это ваши цели, ваши ресурсы и итоги, к которым вы надеетесь прийти»35. Действительно, вопрос об объеме выборки решается индивидуально в зависимости от целей и задач работы и напрямую связан с понятием единицы анализа.