首页 >  Python毕业设计  > 正文

基于文本挖掘的电影评论情感分析

选题意义:
1.本课题研究的理论意义
近年来随着互联网技术不断发展,人们习惯于在网络上发表各种影评、书评、商品评价等,网络成为了人们表达情绪的一个重要渠道。一般来讲,用户在网上发表的评论相对简洁、精确,具有时效性,这些评论中蕴藏的情感信息有着非常大的商业价值。然而,在当前互联网信息量呈指数增长的趋势下,决策者如何在短期内获取有价值的信息,在海量的评论文本中挖掘蕴含情感的信息成为了本次课题的研究对象。
2.本课题研究的现实意义
电影作为一种文化传播的载体,近年来随着互联网的发展,电影文本研究成为了热点,而影评作为观众情绪的反映,一定程度上反映了观众对一部电影的认可程度,也成为了观众选择是否观看一部电影的主要依据。通过python爬虫爬取豆瓣网、猫眼网的评论数据,然后结果数据清洗等一系列操作,借助第三方库进行数据可视化,再对其进行情感分类,构建LDA模型对评论数据做进一步主题分析,以通过了解观众的特征偏好,为相关部门进一步了解市场特点提供建议。另外对于观众来说,可以更直观地了解大众对一部电影的评价,更方便与自己选择是否观看,有着重要的现实意义。
3.必要性及价值
在互联网迅速发展的背景下,准确地从评论文本中识别并提取用户情感倾向,对观众、制片方、影院运营等多方面都具有重要商业参考价值。
 
主要内容:
1.工作内容:
(1)数据获取:文本数据来源豆瓣网、猫眼网及视频网站弹幕文本,利用python爬虫脚本进行数据的爬取并进行存储
(2)数据预处理:爬取到的文本数据,存在数据不规范、重复等问题,且评论文本偏口语化,与真实主题存在偏差。第一步,对数据进行语气词以及停顿词过滤;第二步,去重复值处理;第三步,利用jieba库对处理后的数据进行分词 
(3)数据可视化处理:对评论数据进行基本统计分析,对预处理后的数据利用wordcloud库绘制词云图,更直观的看出观众对影视作品的评价。
(4)情感分析:对每条文本进行情感倾向的分析,将情感倾向平分分为:消极为-1.中性为0,积极为1,进行统计从而做出情感分析。
(5)LDA模型建立:LDA模型通过jieba库进行分词,利用中文的自然语言处理库snownlp进行情感分析,建立词典对文本数据进行训练,最后输出主题。
2.研究或设计方法:
文献综合研究法,实验研究法。
3.预期结果:
对爬取的数据进行了准确地情感分析,建立模型进行主题分析,最终了解观众对影片的看法与表现的情绪,结合观众的情感倾向对电影的传播效果、商业价值等进行分析、评价及建议。
4.拟解决的关键问题及论文(设计)的新意:
LDA模型分析法
5.论文进度安排:
时间                    工作内容                     预期结果
2024.07.10-2024.09.15   查阅资料、选题          完成资料收集、确定论文题目
2024.09.16-2024.10.17   撰写开题报告            完成开题报告
2024.10.18-2024.12.20   软件安装、环境搭建      完成软件安装运行、搭建环境  
2024.12.21-2024.01.20   编写代码、收集数据      完成代码的编写和数据的获取
2024.01.21-2024.02.20   构建模型、分析结果      模型建立并完成数据的结果分析
2024.02.21-2024.03.25   撰写论文初稿            完成论文初稿
2024.03.26-2024.05.22   论文定稿、查重          完成论文撰写
6.实现大纲与内容结构:
1.绪论
1.1本课题研究背景及研究的目的意义
1.2国内外研究现状
1.3主要研究内容
1.4论文结构安排
2.研究方法
2.1爬虫
2.2云词图分析
2.3 sonwNLP情感分析
2.4 LDA建模介绍
3.数据获取和处理 
3.1数据获取
    3.1.1 特殊符号处理
    3.1.2 删除重复词
    3.1.3 去停用词
    3.1.4 分词处理
3.2数据清洗预处理
4.基于文本挖掘的情感分析
4.1词频统计
4.2词云可视化分析
4.3情感倾向分析
5.LDA建模与主题分析
5.1 LDA建模
5.2运用LDA实现主题分析
6.总结
6.1研究结论
6.2不足与展望
已搜集资料及参考文献目录:
[1] 郭锐.基于LDA主题樽型的电商客户评论情感分析[D].北京化工大学. 2017. 
[2] 杨单,程键,姚怡琦,李晓雨.基于文本挖掘的高校网络舆情用户情感分析研究[J].武汉纺织大学学报,2020 .
[3] 邹墨馨,辛雨璇.基于文本挖掘的影视弹幕情感分析研究[J].科技创新与应用,2021.
[4] 旷开金,廖海琳,裴文庆.基于文本挖掘的影评数据情感分析——以《我和我的祖国》为例[J].武夷学院学报,2024,41(05) 
[5]冯莎.豆瓣电影评论文本的情感分析研究:基于2017年电影《乘风破浪》爬虫数据[J].中国统计,2017(7). 
[6]刘敏,王向前,李慧宗,等.基于文本挖掘的网络商品评论情感分析[J].辽宁工业大学学报(自然科学版),2018,38(5).
[7]LIU Z X, ZHANG D G, LUO G Z, et al. A New Method of Emotional Analysis Based on CNN-BiLSTM Hybrid Neural Network[J].Cluster Computing,2020,23(4):2901-2913.
[8]王珠美,胡彦蓉,刘洪久.基于LDA主题模型和直觉模糊TOPSIS的农产品在线评论情感分析[J].数据采集与处,2020,35(5).
[9] GHANEM B, ROSSO P, RANGEL F. An Emotional Analysis of False Information in Social Media and News Articles[J]. ACM Transactions on Internet Technology,2020,20(2).
[10]Ullah Kifayat et al. A Deep Neural Network-Based Approach for Sentiment Analysis of Movie Reviews[J]. Complexity, 2024, 2024
[11] Imen Fadhli and Lobna Hlaoua and Mohamed Nazih Omri. Sentiment Analysis CSAM Model to Discover Pertinent Conversations in Twitter Microblogs[J]. International Journal of Computer Network and Information Security(IJCNIS), 2024, 14(5).
 

以上是本题目部分介绍,若需要完整版或不符合您的要求,请联系客服QQ:242219979

上一篇:人脸识别考勤系统的研究与实现

下一篇:最后一页