文化组学

维基百科,自由的百科全书

文化组学(英語:culturomics)是指通过电子化文本的量化分析研究人类行为与文化趋势的计算词典学英语computational lexicology方法。[1][2]研究者对海量数字档案进行数据挖掘以研究人们使用的语言与词汇,进而揭示其中反应出来的文化现象。[3]“文化组学”一词是2010年创造的新词,由英文中的“文化”(culture)与“组学”(omics)二词合并而成,当年《自然》上发表的《通过海量电子化书籍对文化进行量化分析》(Quantitative Analysis of Culture Using Millions of Digitized Books)一文首次提出了该词。论文的作者为哈佛大学学者让-巴蒂斯特·米歇尔(Jean-Baptiste Michel)与埃雷兹·利柏曼·埃登(Erez Lieberman Aiden)。[4]

米歇尔与埃登还参与了Google实验室的项目Google Ngram Viewer。这个项目通过n元语法(n-gram)分析Google图书中的数据,以展示语言中的文化模式随时间的变化。

参考文献[编辑]

  1. ^ Cohen, Patricia. In 500 Billion Words, New Window on Culture. New York Times. 16 December 2010 [2016-10-16]. (原始内容存档于2021-02-13). 
  2. ^ Hayes, Brian. Bit Lit. American Scientist. May–June 2011, 99 (3): 190. doi:10.1511/2011.90.190. (原始内容存档于2016-10-18). 
  3. ^ Letcher, David W. Cultoromics: A New Way to See Temporal Changes in the Prevalence of Words and Phrases (PDF). American Institute of Higher Education 6th International Conference Proceedings. April 6, 2011, 4 (1): 228 [2016-10-16]. (原始内容 (PDF)存档于2016-03-03). 
  4. ^ Michel, Jean-Baptiste; Liberman Aiden, Erez. Quantitative Analysis of Culture Using Millions of Digitized Books. Science. 16 December 2010, 331 (6014): 176–82 [2016-10-16]. PMC 3279742可免费查阅. PMID 21163965. doi:10.1126/science.1199644. (原始内容存档于2012-04-24). 

外部链接[编辑]