岗位认证介绍
Introduction to post certification
一、适用人群
1. 持有该专业初级证书
2. 应用型本科在校学生
3. 普通本科非专业在校学生
4. 从事该岗位满一定年限的从业人员
5. 符合本规定中级资格界定标准的人员
二、岗位能力要求
a)综合能力
——能够深入分析自然语言处理的个性化业务的需求,理解对应方向的相关评价指标与算法的原理与适用场景,根据不同的场景和数据可以做出合理的选择;
——能够通过合理的组合、改造并创新相关的自然语言处理算法来解决更加复杂的应用问题,可以对模型根据问题进行性能调优与速度优化;
——能够对不同场景的通用部分进行提取,提高算法的迁移与扩展能力并降低训练成本。
b)专业知识能力
——具备数据结构与算法基础,掌握语言模型、词性标注、句法分析、文本分类、信息抽取、信息检索等常用自然语言理解算法,掌握机器翻译、问答系统、自动摘要等常用自然语言生成算法,并能熟练应用;
——精通机器学习与数据挖掘基础,熟悉基于规则或统计的相关算法模型的构建与应用;
——熟悉深度学习方向的模型建构、模型训练和评价指标体现。
c)技能能力
——具备扎实的编程开发基础,熟练掌握C/C++、Python、Java等编程语言,熟悉Linux开发环境;
——能够实现和使用相关算法,熟悉如Jieba、HanLP、Standford等常用工具的使用;
——熟悉常见的文本处理方法,如词嵌入、LSTM、GRU、Transformer;
——熟悉CBoW、SkipGram、FastText等常用词嵌入的训练与使用方法,了解对应的困惑度评价指标的原理;
——熟悉ELMo、BERT等常用语言模型的构建与使用方法,在此基础上熟悉常用的分词算法;
——熟悉序列标注类问题对标签与输出的建模,了解条件随机场等模型的建模原理与使用方法;
——熟悉基于转移和基于图的常用句法分析方法,了解LAS、UAS等对应评价指标;
——熟悉基于规则和基于统计的相关信息抽取方法;
——熟悉抽取式和生成式的常用自动摘要算法,了解包括BLUE、ROUGE在内的评价指标。
d)工程实践能力
——拥有信息抽取系统、机器翻译系统、搜索引擎等方面相关算法的开发经验;
——可以根据不同问题合理搭建网络结构,选择合适的损失函数;在此基础上有算法复杂度分析与优化能力,可以提供高效的处理算法;
——能够快速选择并实现常见的自然语言处理算法模型,准确理解业务需求,提供相应的解决方案;根据实际的场景完成文本清洗工作,选择合适的算法与评价指标并进行调优;
——能够总结不同项目的共同点,提供更具有通用性、可迁移的算法框架,减少新项目的迁移成本。
三、考纲明细
四、学习路径
(一)掌握六门基础课程
1. 《人工智能导论》
2. 《人工智能应用基础》
3. 《Linux系统管理》
4. 《数据库技术及应用》
5. 《Python程序设计》
6. 《大数据平台应用》
(二)掌握四门专业核心课程
1. 《深度学习》
2. 《自然语言处理开发与应用》
3. 《计算机和大数据基础》
4. 《机器学习》
(三)熟练学习三个实训项目
1. 人工智能基础
2. Python基础
3. 机器学习
(本岗位考纲及题库由华中科技大学人工智能与自动化学院建设)