首页 >  Python毕业设计  > 正文

python网络爬虫之古典诗词阅读系统

中国古典诗词,是中华传统文化的瑰宝,民族精神的精华,是中国传统文化的精粹,在中国璀灿的古代文化中占有重要的地位。古诗不仅内涵丰富、包罗万象、意境深邃,具有很高的审美价值和很强的艺术感染力,而且语言凝练、短小精悍,词句优美,韵体和谐,使得其在中国文坛上独树一帜。作为中国古代文化的一个重要组成部分,古诗经过了千百年的沉积与流传,是前人留下的珍贵的文化遗产,更是传扬中华民族精神文化的重要载体。读史书使人明智,读诗书使人灵秀。"学习古诗词不仅能使人灵秀,更重要的是使人脱离庸俗和低级趣味,更加文明和高雅。
学习古典诗词,对于所有人的意义:
1.阅读古典诗词,促进人们了解历史文化。
2.阅读古典诗词,增加人们对人类本身的了解,增加人生体验,丰富人们的感觉细胞。饥者歌其食、劳者歌其事。
3.阅读古典诗词,能够培养人们的审美能力。“腹有诗书气自华”!
4.学习古典诗词,可能会激发我们的表达和写作热情,而写作对人们认识和完善自我,具有特别的意义。
5.古典诗词可能作为触媒,促使人们注重思考和表达,从而丰富和提升人们的能力和素质,进而为人们在现实生活中,赢得更多的机会。
6.优秀的古典诗歌含蓄蕴藉的表达方式,对提升人们的教养,具有特别的借鉴价值。优秀的古诗词,多半是乐而不淫,哀而不伤,怨而不怒,温柔敦厚。优秀古典诗歌的素养,可以说是一种重要的文明教养。
而对于适应快节奏生活的现代人来说,阅读基本上已脱离纸质书籍,利用网络获取资源成为当代人的首选。电脑及手机的普及,网络的发达,已经改变了人类的生活模式,网络不仅仅是人们表现自我的空间,更是人们学习、工作、提取信息和进行交流的工具,它带领人类进入一个崭新的时代。而诗歌的交流,也不能仅仅局限于课本上所能接触的那些,而雅韵古诗词网则是为对于欣赏甚至研究中国古典文学中关于诗歌的部分,为其提供一个可以搜索,浏览古诗词的一个平台。.
 
鉴于此,对于此网站的搭建过程,关键问题在于如何将大量的诗词信息为我所用,即从海量数据中快速获取有效信息。随着人工智能时代的到来,对于数据的分析是一项重要的工作,然而在互联网中通过的搜索关键字得到的数据是海量的若仅仅依靠人力从大量数据分析统计是不可能的,不仅耗时周期长,而且得到的结果不一定准确,需要反复校对现代生活是快节奏的,通常希望更快处理所遇到的问题,再投入到其它待处理的工作中,面对如此复杂枯燥的工作,如果能通过机器自动来处理收集,那么就会有更多时间来进行其它的工作。
在机器学习中,网络爬虫技术可实现对网页上信息数据爬取,通过设计定制的网络爬虫来爬取搜索结果,筛选出重要数据,提升自动化程度,大大缩减在无用信息上花费的时间,使得工作效率更高。经过,经网络爬虫后能简化搜索,诗词相关的信息一目了然,方便浏览、借鉴。
在国内,关于网络爬虫技术的研究始终没有停止,许多高校的网络技术实验室都有专门的研究团队在研究成果中,北京大学的“北大天网”系统在国内具有颇高的影响。作为国内第一个基于索引搜索的搜索引擎,北大天网使用分布式技术替代集中式,在性能上有很大提升,使其可以对海量的页面进行爬取和搜索,进而向众多互联网访问者提供快捷的网页信息搜索及导航服务。
此外,国内其他重点高校如北京航空航天大学,西安电子科技大学等都对网络爬虫技术也有深入研究并提出相关成果。然而,随着互联网中数据量的不断增加,以及大数据、云计算
、人工智能等新兴技术的发展,对网络爬虫的要求也不断提高,甚至需要对网络爬虫的框架以及爬取策略做出调整,以满足不断发展的行业需求。
 
 
系统设计管理:
1.主页面设计实现
2.古诗词类别列表页实现
3.诗词作者类别列表页实现
4.诗词所属朝代类别列表页实现
5.古诗词内容实现(包括译文赏析,作者介绍)
6.古诗词收藏实现
7.用户登录页面设计实现
8.用户评论页面设计实现
目标:1.实现相关页面功能
2.存储数据测试
3.美化页面
4.实现收藏,评论等特色功能
研究方法:
1.数据采集:HTTPClient,HTMLCleaner,Xpath,正则表达式
2.数据存储:mysql,Redis
3.数据处理:solar,es
4.数据展示:freemaker,Jquery+HighChart
进度:目前已完成知识储备阶段和测试数据收集
      实现数据采集

以上是本题目部分介绍,若需要完整版或不符合您的要求,请联系客服QQ:242219979

上一篇:Python数据结构-课程网站的设计

下一篇:人脸识别技术在校园宿舍出入系统的应用