中国社会科学院民族学与人类学研究所“民族语言文化行为实验研究室”前身名称为“语音学与计算语言学研究室”(1985年成立),2015年更名为“民族语言实验研究室”,2023年更名为现名。本实验室自成立以来,几经更名,但推进学科交叉融合的核心宗旨未发生根本变化,在1985年初创研究室时,设立的研究方向包括声学语音学、计算语言学、语料库语言学、民族语言应用研究等,设置的研究方向充分体现了人文社会科学和自然科学的交叉科学性质。随着大数据分析、自然语言处理、人工智能技术在人文社会科学研究领域的作用越来越明显,学科交叉深度融合成为一种趋势。民族学与人类学研究所党委审时度势,依靠本所多学科特点,以马克思主义民族理论为指导,以铸牢中华民族共同体意识为主线和目标,以语言文化行为为研究对象,组建民族学与人类学交叉学科研究团队,将数据科学和技术应用于民族学研究中,利用机器学习、人工智能等技术进行数据挖掘和模式识别,通过采集、处理、分析、挖掘和可视化,深入探究民族理论和实践问题,从而发现和分析民族地区社会和文化中的模式、规律和趋势,深化对民族地区和民族问题的认识,为促进民族地区高质量发展和现代化建设提供理论支撑和决策服务。
序号 | 项目名称 | 主持人 | 项目来源 | 立项年份 | 项目预算(万元) | 项目简介 |
---|---|---|---|---|---|---|
1 | 多民族语言《十三经》跨学科研究及数据库建设(子课题) | 龙从军 | 国家社会科学基金 | 2022 | 0.0 | ... |
2 | 中国民族语言大规模语法标注文本在线检索系统研(子课题) | 龙从军 | 国家社会科学基金 | 2021 | 0.0 | ... |
3 | 藏汉双语藏文古籍知识图谱构建研究 | 安波 | 国家社会科学基金 | 2022 | 0.0 | ... |
4 | 藏文古文献《韦协》《柱间史》《底吾史记》文本标注与语法研究 | 龙从军 | 国家社会科学基金 | 2020 | 0.0 | ... |
5 | 藏文古文献《拔协》文本标注与语法研究 | 龙从军 | 国家社会科学基金 | 2019 | 0.0 | ... |
6 | 知识增强的中文复述识别关键技术研究 | 安波 | 国家自然科学基金 | 2020 | 0.0 | ... |
7 | 基于本体的多策略民汉机器翻译研究(自然基金重点子项目) | 江荻 | 国家自然科学基金 | 2012 | 0.0 | ... |
8 | 从世界语言透视东亚人群和语言的起源与演化 | 江荻 | 国家自然科学基金 | 2012 | 0.0 | ... |
9 | 面向信息处理的现代藏语语法属性库研究 | 江荻 | 国家自然科学基金 | 2004 | 0.0 | ... |
10 | 基于词典和格标记的现代藏语自动分词系统研究 | 江荻 | 国家自然科学基金 | 2001 | 0.0 | ... |
11 | 基于动态腭位(EPG)的蒙古语标准音协同发音研究 | 呼和 | 国家自然科学基金 | 2008 | 0.0 | ... |
12 | 基于EPG的蒙古语辅音丛研究 | 哈斯其木格 | 国家自然科学基金 | 2007 | 0.0 | ... |
13 | 基于动态腭位(EPG)的普通话协同发音研究 | 郑玉玲 | 国家自然科学基金 | 2003 | 0.0 | ... |
14 | 濒危少数民族语言语音声学数据库及声学分析 | 黄行 | 国家自然科学基金 | 2006 | 0.0 | ... |
15 | 中国民族语言语法标注文本及软件平台 | 黄行 | 国家社会科学基金 | 2010 | 0.0 | ... |
16 | 基于大型词汇语音数据库的汉藏历史比较语言学研究 | 江荻 | 国家社会科学基金 | 2015 | 0.0 | ... |
17 | 鄂温克语辉方言调查 | 乌日格喜乐图 | 教育部 | 2020 | 0.0 | ... |
18 | 鄂温克语敖鲁古雅方言调查 | 乌日格喜乐图 | 教育部 | 2020 | 0.0 | ... |
19 | 鄂伦春语调查 | 乌日格喜乐图 | 教育部 | 2020 | 0.0 | ... |
20 | 鄂温克语陈方言调查 | 乌日格喜乐图 | 教育部 | 2020 | 0.0 | ... |
21 | 蒙古语巴尔虎-布里亚特方言新巴尔虎土语 | 哈斯其木格 | 教育部 | 2020 | 0.0 | ... |
22 | 民族语言调查•西藏狮泉河藏语卫藏方言阿里次方言 | 龙从军 | 教育部 | 2020 | 0.0 | ... |
23 | 民族语言调查•西藏狮泉河藏语卫藏方言阿里次方言 | 龙从军 | 教育部 | 2020 | 0.0 | ... |
24 | 民族语言调查•青海泽库藏语安多方言泽库土语 | 龙从军 | 教育部 | 2020 | 0.0 | ... |
25 | 民族语言调查•甘肃迭部藏语康方言迭部话 | 龙从军 | 教育部 | 2020 | 0.0 | ... |
26 | 民族语言调查•西藏日土藏语阿里土语日土话 | 龙从军 | 教育部 | 2020 | 0.0 | ... |
27 | 民族语言调查•西藏康方言芒康话 | 龙从军 | 教育部 | 2020 | 0.0 | ... |
28 | 民族语言调查•青海玉树藏语康方言囊谦话 | 龙从军 | 教育部 | 2020 | 0.0 | ... |
29 | 藏语句法树库构建 | 龙从军 | 教育部 | 2020 | 0.0 | ... |
30 | 达斡尔、鄂温克和鄂伦春语语音声学参数数据库 | 呼和 | 教育部 | 2020 | 0.0 | ... |
31 | 鄂伦春、鄂温克、达斡尔语语音声学参数库,农牧民国家通用语学习系统软件(APP)升级整合服务 | 呼和 | 内蒙古自治区呼伦贝尔市政府委托的重大项目 | 2020 | 0.0 | ... |
32 | 藏语语音数据采集与标注 | 龙从军 | 中国民族语文翻译中心(局)委托 | 2020 | 0.0 | ... |
33 | 藏语分词和词性标注语料库加工 | 龙从军 | 讯飞科技有限责任公司委托 | 2020 | 0.0 | ... |
34 | 中华字库项目(藏文部分) | 龙从军 | 新闻出版总署项目 | 2020 | 0.0 | ... |
35 | 藏语拉萨话语音识别系统 | 龙从军、周学文 | 国家863项目子项目 | 2020 | 0.0 | ... |
36 | 新疆阿布达里语实验研究 | 阿米娜木 | 人社部项目 | 2020 | 0.0 | ... |
37 | 维吾尔语语码转换研究 | 阿米娜木 | 德国2014国际项目 | 2020 | 0.0 | ... |
眼动仪是心理学基础研究的重要仪器。眼动仪用于记录人在处理视觉信息时的眼动轨迹特征,广泛用于注意、视知觉、阅读等领域的研究。
脑电技术就是是通过采集和分析由刺激事件诱发的大脑脑电波来探索心理活动的脑反应。该技术已广泛应用于认知心理学、认知神经科学、医学和人体工学等领域。
GPU:4*英伟达 TESLA V100 32G
网络1:双口千兆网口
IPMI远程管理口
2000W 电源
Psychopy、E-Prime、Python等是编制心理学实验程序或处理实验数据的常用工具。它们可以将各种视觉或听觉刺激按照特定的实验范式或实验参数编制成实验运行程序,采集被试在完成实验任务过程中的反应时、正确率等行为数据,也能同时采集脑电、眼动等其他指标,并对采集的行为数据进行预处理或统计分析。
学历要求:通常需要硕士或博士学历,特别是在语言学、人类学、历史学或相关领域有深入研究。
语言能力:除了母语外,还需要掌握至少一种少数民族语言,以及其他外语(如英语)的能力。
研究经验:有相关领域的研究经验,熟悉民族语言文化研究的理论和方法。
沟通能力:能够与不同文化背景的人进行有效沟通,具备良好的团队协作能力。
写作能力:能够撰写清晰、准确的研究报告和技术文档。
计算机技能:熟悉计算机操作,能够使用统计软件和办公软件进行数据分析和文档编辑。
对民族文化的热爱和尊重:对民族语言文化有深厚的兴趣和热情,尊重和珍视各民族的文化传统。
面谈
数据收集与整理:负责从各种渠道收集相关领域的数据,包括书籍、论文、报告、网站等,并进行整理和分类。
知识抽取:利用自然语言处理技术,从文本中抽取出关键信息,形成结构化数据。
知识表示:将结构化数据转化为计算机可以理解的形式,如关系数据库或图结构。
知识融合:对来自不同来源的知识进行整合,消除重复和矛盾,形成一个统一的知识库。
知识检索与推荐:为用户提供高效的检索和推荐功能,帮助用户找到所需的知识。
知识维护:定期更新和维护知识库,确保知识的准确性和时效性。
数据分析:对用户的使用行为进行分析,以便优化知识库的功能和服务。
面谈