首页 >  任务书  > 正文

社交媒体大数据的分析和挖掘毕业设计

社交网络已经成为现实世界的映射,人们可以在社交网络上发表观点、心情、看法等。由此,导致了大量的社交媒体数据。反过来,通过对社交媒体数据的分析和挖掘可以提取某一个时间段,人们的情感状态等。因此,社交大数据中的事件挖掘具有重要的意义。与传统的文本类的媒体不同,例如博客、新闻网站等,社交大数据中有一个重要的元素就是用户,其有属性特征,包括年龄、性别、职业等,又有行为特征包括发文、转发、评论等,因此,用户与用户之间就形成了复杂的群体关系,通常被称为社区。属于同一个社区的用户具有相同的兴趣或者观点。本课题在微博、推特等社交媒体基础上,研究用户与用户之间的相互关系,以及由此形成的群体智能,并研究该群体智能在事件的产生、发展、消失过程中的变化趋势。
通过本设计,可加深学生对人工智能技术,特别是人工智能模型、算法开发的体验与掌握;使学生将使用最流行的技术来解决实际问题。同时,了解人工智能等领域的基本概念。使学生了解实际软件系统设计的过程与方法,获得经验与成果,为走上实际岗位打下良好的基础。其研究内容主要包括:
1. 查阅相应参考文献,熟悉常用的算法;
2. 掌握社交大数据处理的常见工具和方法;
3. 对用户与用户的相互关系建模,并基于此提出事件挖掘算法,验证算法,需要独立完成系统的设计和程序的开发,完成核心代码;
4. 本毕设主要包含以下部分:
        本毕设主要包括以下三个功能模块:(1)数据获取:设计爬虫软件,获取Twitter、新浪微博等社交媒体上的数据;(2)事件挖掘算法:单纯的自然语言处理方法存在着自然语言处理中的词的模糊性、多义性等问题,因此,本课题系统通过用户关系的建模,提升事件检测的效率。一个建议的思路为,构建用户之间的交互网络,并进行社区提取,通常一个社区对应一个事件。通过交互网络的演化,研究事件的演化;(3)仿真系统及其算法验证:使用Python编程语言,验证本文中的算法、模型,给出可视化的结果。
        5.在收集、查阅大量相关的书籍和文献资料,通过对这些资料的阅读、思考和学习,确立论文的整体框架。在完成论文过程中要及时向导师汇报研究进展,加强同导师的沟通,不断调整研究思路,获得更新更好的信息。
二、 技术要求
开发工具:Python编程语言
其它工具:PyGame、Open AI
要求论文正文不少于1.8万字,外文翻译3000~5000字,提交源程序。
三、 成果形式
1. 开题报告1份(不少于2千字)
2. 文献翻译1份(不少于2万印刷字符)
3. 程序设计源程序1份
4. 毕业设计报告1份(不少于1.8万字)
 

以上是本题目部分介绍,若需要完整版或不符合您的要求,请联系客服QQ:242219979

上一篇:面向特定主题的网络爬虫设计与实现

下一篇:基于HBase的经营数据多维分析系统