Введение в прикладную лингвистику. Корпусная лингвистика
Ссылки на лингвистические ресурсы
Ссылки на каталоги:
Некоторые полезные лингвистические сайты
Общее
http://linguistlist.org/main.html - крупнейший общий информационный ресурс для лингвистов всего мира - информация о всех происходящих в мире конфренциях, издаваемых лингвистических журналах и книгах, предложений о работе, электронных ресурсах и т.п. Отражены самые разные направления и тематика: начиная от обучения языку и кончая программным обеспечением систем обработки естественного языка.
MOSLING (www.yahoogroups.com > искать группу mosling) - Московская лингвистическая рассылка
http://www.sil.org/linguistics/topical.html - сайт Летнего лингвистического института (SIL). Деятельность по описание малых языков. Шрифты, программы.
http://www.mpi.nl/index.html - Max Planck Institute for Psycholinguistics (MPI). Программы. LAN (Language Archives Newsletter). Электронные архивы DoBeS и других проектов.
http://www.glottopedia.org/ - специализированная вики-энциклопедия по лингвистике
http://www.ethnologue.com/ - база данных по языкам мира
Русский язык
http://gramota.ru/ - Портал по русистике. Ссылки на словари, справочная служба по русскому языку
http://feb-web.ru/feb/feb/sites.htm?cmd=show - Каталог сетевых ресурсов по русской филологии и фольклору ( http://feb-web.ru/)
http://starling.rinet.ru/indexru.htm - Проект Сергея Старостина "Вавилонская башня". Этимологическая база данных. Утилиты для русского языка (морфологический анализ и др.).
Каталоги ссылок на корпуса и литературу по корпусной лингвистике
Ссылки на некоторые сайты, посвященные корпусной лингвистике, сайты рабочих групп по корпусной лингвистике и другим ресурсам обработки естественного языка:
http://www.essex.ac.uk/linguistics/clmt/w3c/corpus_ling/content/introduction.html
http://www.language-archives.org/ -- OLAC (Open Language Archives Community)
http://www.fltr.ucl.ac.be/FLTR/GERM/ETAN/CECL/references.html - The UCL Centre for English Corpus Linguistics (CECL)
http://www.athel.com/corpus.html - Rice University
http://www.engl.polyu.edu.hk/corpuslinguist/
http://devoted.to/corpora - David Lee's Bookmarks for Corpus-based Linguistics
Примеры конкордансов:
http://www.ling.lancs.ac.uk/monkey/ihe/linguistics/corpus4/4fra1.htm
http://dostoevskii.karelia.ru/index.phtml
http://www.inforeg.ru/electron/concord/concord.htm
Другие полезные каталоги лингвистических ресурсов:
http://www.sfb441.uni-tuebingen.de/c1/corpora.html - сайт Тюбингенского университета
http://www.mccme.ru/ling/links.html
http://etext.lib.virginia.edu/tei/uvatei.html - The Electronic Text Center Introduction to TEI
http://www.ldc.upenn.edu/ Linguistic Data Concorcium
http://www.rvb.ru/soft/catalogue/index.html - Каталог лингвистических программ и ресурсов в Cети (составитель Логичев)
Примеры коллекций текстов:
http://lib.ru/ - Библиотека Максима Мошкова
http://gramoty.ru/ - Древнерусские берестяные грамоты
http://ota.ox.ac.uk/ - Коллекция текстов на английском языке, пример минимальной метаразметки
Дополнительные ссылки
http://www.mccme.ru/ling/links.html - Центр по сохранению лингвистических данных
http://www.ling.upenn.edu/mideng/
http://www.staff.amu.edu.pl/~przemka/corplink.html
http://www.ling.upenn.edu/mideng/ - The Penn-Helsinki
Parsed Corpus of Middle English - примеры морфологической и синтаксической разметки
http://helmer.aksis.uib.no/icame.html - ICAME
Корпуса on-line для ознакомления
Национальный корпус русского языка http://ruscorpora.ru/
Английский конкорданс on-line http://humanities.uchicago.edu/forms_unrest/ARTFL.wl.html
British Nasional Corpus http://www.hcu.ox.ac.uk/BNC/index.html (а также в к. 949)
Тюбингенский корпус http://www.sfb441.uni-tuebingen.de/b1/rus/korpora.html
Конкорданс публицистики Достоевского http://mmedia3.soros.karelia.ru/~dost_voc/
http://www.collins.co.uk/ - главная страница Collins
http://www.collins.co.uk/Corpus/CorpusSearch.aspx - демонстрация возможностей поиска - Bank of English - материалы группы по созданию словарей на базе корпусов (Cobuild)
http://corp.hum.ou.dk/corpustop.html
http://www.americancorpus.org/
http://www.euskaracorpusa.net/XXmendea/Konts_arrunta_fr.html -- корпус баскского языка
http://corpus.leeds.ac.uk/ruscorpora.html
Программа Systemic Coder
Coder v4.6 — программа
Coder v4.6 — справочные материалы
Пример размеченного корпуса
Новая версия Кодера — UAM CorpusTool: http://www.wagsoft.com/CorpusTool/
Регулярные выражения
Примеры синтаксиса и задания |