复试科目 :数据库、人工智能、自然语言处理及社交网络分析 一、 数据库部分
1. 考试的总体要求
理解并掌握关系模型的基本理论;熟练掌握使用 SQL 定义数据、查询数据和更新数据;理解关系数据库的规范化理论;熟练掌握使用E/R 图建立概念模型;理解数据库完整性;掌握视图、索引和存储过程的使用;理解数据库安全性,掌握 SQL 提供的用户授权机制;理解数据库恢复和并发控制技术。
2. 考试的内容及比例
本课程考试的内容包括:
1)数据模型与关系代数(20%)
2)SQL(20%)
3)数据库设计与规范化理论(20%)
4)数据库对象(20%)
5)并发控制与日志恢复(20%)
3. 参考书目
(1) Jeff Ullman and Jennifer Widom. A First Course inDatabase Systems. Third Edition. Prentice Hall, 2007. (《数据库系统基础教程》(英文版 第 3 版)机械工业出版社 影印)
(2) Hector Garcia-Molina, Jeff Ullman and Jennifer Widom.Database System Implementation. Second Edition. PrenticeHall, 2008. (《数据库系统基础教程》(英文版 第 2 版)机械工业出版社 影印)
二、 人工智能 部分
1. 考试的总体要求
掌握人工智能的发展历史和基础知识;了解智能体与环境的概念;
掌握常见的搜索技术(包括无启发式搜索和启发式搜索策略),并会根据具体问题设计搜索算法;了解复杂环境下的搜索策略,包括局部搜索策略和带有限制条件的搜索策略;了解对抗搜索策略,包括启发式 alpha-beta 剪枝搜索和蒙特卡洛树搜索方法,了解典型图搜索策略,以及上述不同搜索方法的优缺点;掌握并能够推导常见数据挖掘及机器学习方法,包括传统典型分类等非深度学习算法以及典型深度学习算法等;了解人工智能的在自然语言处理等不同领域的具体应用等。
2. 考试的内容及比例
本课程考试的内容包括:
1)人工智能领域常见概念解释(20%)
2)搜索算法设计与分析(30%)
3)机器学习常见算法(30%)
4)人工智能具体应用(20%)
3. 参考书目
(1) Artificial Intelligence: a modern approach. 4thEdition by Stuart Russell and Peter Norvig. Prentice Hall,2013(《人工智能:一种现代化方法》(第三版)),清华大学出版社
三、 自然语言处理 部分
1. 考试的总体要求
理解并掌握自然语言处理中的基本概念以及常用机器学习方法;熟练掌握中文自然语言处理中的分词、词性以及句法语义分析模型;理解语言模型的相关定义以及其在自然语言处理中的关键作用;掌握并理解情感分析、数据挖掘的任务涵盖以及其建模框架;掌握并理解文本生成的任务涵盖及其核心框架。
2. 考试的内容及比例
本课程考试的内容包括:
1)自然语言处理相关概念及其延伸(20%)
2)自然语言处理常用机器学习方法(20%)
3)中文词法句法语义分析模型(10%)
4)语言模型进展及其应用方法(10%)
5)情感分析与数据挖掘(20%)6)文本生成(20%)
3. 参考书目
(1) 《基于深度学习的自然语言处理》约阿夫·戈尔德贝格著,
车万翔,郭江,张伟男,刘铭译,机械工业出版社
(2) 《统计自然语言处理》(第 2 版)宗成庆 著,清华大学出版社
四、 社交网络分析 部分
1. 考试的总体要求
掌握社交网络中多层网络、时序网络、图网络和自适应网络等;
掌握社交网络文本情感分析的主要模型与链路预测分析方法;掌握常见的动态社区发现算法;掌握社交网络与计算传播学的基本概念;掌握影响信息传播的可计算因素;掌握常见的传播算法,如page-rank、leader-rank,k-kernel 等;掌握信息扩散模型,包括 Markov 随机场图模型等;了解计算传播学在新闻和公共舆论领域的应用;了解社交
网路在不实信息传播、情感分析、热点事件分析的具体应用。
2. 考试的内容及比例
本课程考试的内容包括:
1)常见概念解释(10%)
2)算法设计与分析(40%)
3)社交网络与计算传播学模型(20%)
4)社交网络应用(15%)
5)计算传播学应用(15%)
3. 参考书目
(1)《社交网络上的计算传播学》(2015),许小可 胡海波 张伦王成军,高等教育出版社
(2)《社交网络分析》,刘小洋,2021,电子工业出版社
|