美国当代英语语料库?Crown and CLOB语料库 北京外国语大学开发的,与Brown和LOB语料库的结构和规模相类似,各有约一百万个运行词,Crown and CLOB语料库旨在分别提供具有代表性的当代美国英语和英国英语样本集。那么,美国当代英语语料库?一起来了解一下吧。
COHA/COCA这种小型语料库,作为美国当代英语语料库,于 2008年 2月 20日推出,起初包含的词汇量在 3.2 亿左右,并且每年以 2000 万的速度增加,2017 年已达到 4.5 亿甚至更多
美国当代英语语料库(Corpus of Contemporary American English,简称COCA)已包含5.6亿字的文本,是目前最大的免费英语语料库。1990年至2017年,COCA以每年2000万字的速度更新扩充,以保证语料库内容的时效性。其语料均衡分布在口语、小说、杂志、报纸以及学术文章五类文体中,被认为是用来观察美国英语当前发展变化的最合适的英语语料库,也是广大英语爱好者的学习宝库。

发展迅速。语料库的发展与现状自1979年中国开始建立机器可读的语料库以来,国内语料库发展迅速,取得了相当一部分的成就。

Crown_CLOB语料库是由北京外国语大学中国外语教育研究中心的许家金副教授和梁茂成教授于2012年建成的通用语料库。
布朗标准美式英语语料库(Brown Corpus of Standard American English)
第一个现代的计算机可读的通用语料库。它的语料源自新闻报道、小说等15大类500篇文本,每篇2000个单词,共计100万个单词。
Crown and CLOB语料库
北京外国语大学开发的,与Brown和LOB语料库的结构和规模相类似,各有约一百万个运行词,Crown and CLOB语料库旨在分别提供具有代表性的当代美国英语和英国英语样本集。
1.英国国家语料库(BNC)
网站地址:
http://www.natcorp.ox.ac.uk/
英国国家语料库(British National Corpus)是目前世界上非常有代表性的当代英语语料库之一,由英国牛津出版社、朗文出版公司、牛津大学计算机服务中心、兰卡斯特大学英语计算机中心以及大英图书馆等联合开发建立。以来源广泛的书面语和口语为样本,呈现了20世纪后期以来的英式英语。其中词容量超过一亿,书面语占90%,口语占10%。
BNC包含了各个年龄段、各个社会阶层的语言,覆盖英国语言的方方面面。整个语料库包含4054篇文本取样,每篇抽样文本的长度不超过45000词。
2.美国当代英语语料库(COCA)
网站地址:
https://www.english-corpora.org/coca/
美国当代英语语料库,简称COCA,是目前最大的免费英语语料库,它由包含 5.2 亿词的文本构成,这些文本由口语、小说、流行杂志、报纸以及学术文章五种不同的文体构成。从 1990 年至 2015 年间语料库以每年增加两千万词的速度进行扩充,以保证语料库内容的时效性。因此,美国当代英语语料库被认为是用来观察美国英语当前发展变化的最合适的英语语料库。
以上就是美国当代英语语料库的全部内容,美国当代英语语料库(COCA)使用说明http://corpus.byu.edu/coca一、COCA语料库简介•COCA简介–COCA:美国当代英语语料库(CorpusofContemporaryAmericanEnglish)是由美国杨伯翰大学(BrighamYoungUniversity)的MarkDavies教授开发的美国最新当代英语语料库,是当今世界上最大的英语平衡语料库。