社交媒体大数据的分析和挖掘毕业设计

社交网络已经成为现实世界的映射，人们可以在社交网络上发表观点、心情、看法等。由此，导致了大量的社交媒体数据。反过来，通过对社交媒体数据的分析和挖掘可以提取某一个时间段，人们的情感状态等。因此，社交大数据中的事件挖掘具有重要的意义。与传统的文本类的媒体不同，例如博客、新闻网站等，社交大数据中有一个重要的元素就是用户，其有属性特征，包括年龄、性别、职业等，又有行为特征包括发文、转发、评论等，因此，用户与用户之间就形成了复杂的群体关系，通常被称为社区。属于同一个社区的用户具有相同的兴趣或者观点。本课题在微博、推特等社交媒体基础上，研究用户与用户之间的相互关系，以及由此形成的群体智能，并研究该群体智能在事件的产生、发展、消失过程中的变化趋势。

通过本设计，可加深学生对人工智能技术，特别是人工智能模型、算法开发的体验与掌握；使学生将使用最流行的技术来解决实际问题。同时，了解人工智能等领域的基本概念。使学生了解实际软件系统设计的过程与方法，获得经验与成果，为走上实际岗位打下良好的基础。其研究内容主要包括：

1. 查阅相应参考文献，熟悉常用的算法；

2. 掌握社交大数据处理的常见工具和方法；

3. 对用户与用户的相互关系建模，并基于此提出事件挖掘算法，验证算法，需要独立完成系统的设计和程序的开发，完成核心代码；

4. 本毕设主要包含以下部分：

本毕设主要包括以下三个功能模块：（1）数据获取：设计爬虫软件，获取Twitter、新浪微博等社交媒体上的数据；（2）事件挖掘算法：单纯的自然语言处理方法存在着自然语言处理中的词的模糊性、多义性等问题，因此，本课题系统通过用户关系的建模，提升事件检测的效率。一个建议的思路为，构建用户之间的交互网络，并进行社区提取，通常一个社区对应一个事件。通过交互网络的演化，研究事件的演化；（3）仿真系统及其算法验证：使用Python编程语言，验证本文中的算法、模型，给出可视化的结果。

5.在收集、查阅大量相关的书籍和文献资料，通过对这些资料的阅读、思考和学习，确立论文的整体框架。在完成论文过程中要及时向导师汇报研究进展，加强同导师的沟通，不断调整研究思路，获得更新更好的信息。

二、技术要求

开发工具：Python编程语言

其它工具：PyGame、Open AI

要求论文正文不少于1.8万字，外文翻译3000~5000字，提交源程序。

三、成果形式

1. 开题报告1份（不少于2千字）

2. 文献翻译1份（不少于2万印刷字符）

3. 程序设计源程序1份

4. 毕业设计报告1份（不少于1.8万字）

首页 > 任务书 > 正文

快捷导航

最近更新

热门作品