首页 >  任务书  > 正文

对文本观点句识别工具的需求分析

功能一:单个文档或多个文档的导入。文本观点句识别工具提供一个导入本地文件的功能,用户通过查找打开本地文件,可以同时导入一个或多个文本文档,文档格式要求为txt格式。
功能二:分句功能。文本观点句识别工具将对文档集中所包含的句子进行识别判断,以句子为单位(工具通过句尾标点符号进行判断)对原文件内容进行编号。
功能三:识别功能。文本观点句识别工具会按编号扫描句子,对每一个句子是否是观点句进行识别,并标注识别结果。
功能四:对识别结果进行标注。文本观点句识别工具界面会设计一个状态栏,用于显示当前处理文档的识别结果,状态栏分行列显示,每个句子占一行;三列分别为:句子编号(来源于分句结果);句子内容(限于篇幅只显示前50个汉字);识别结果(是观点句标注为Y,非观点句标注为N)。
功能五:观点句的统计功能。文本观点句识别工具可以在界面上进行识别结果操作,点击”识别结果”后,状态栏中只显示观点句的处理结果。便于统计观点句的数量,分布,可以直观的反映出所有的观点句。
功能六:识别记录导出。文档识别结果如果需要保存,文本观点句识别工具会提示用户选择一个存储路径(要么是存储于原文档所属的文件夹,要么是创建新的路径),处理结果会以txt文本格式导出到用户所选择的路径;默认命名方式是在“原文件名+观点句分析结果”。
4.2 对功能的一般性规定
在所处理的文本中,对所有句子顺次进行编号。在输出结果,句子编号保持不变。
4.3 对性能的一般性规定
4.3.1 精度
对输入输出文本的存储格式要求为txt文本格式;字词编码为简体中文。
4.3.2 时间特性要求
依照所处理文本的内容大小以及其信息量,允许工具运行时间有一定浮动;只设置最大时间限制。
4.3.3 灵活性
在以下方面考虑进一步的功能拓展:更多的文本格式、更多的文字语言、更多的同时处理的文档数与更大的文本容量等等。
4.4 输入输出要求
输入输出的要求包括:纯文本格式txt文件、简体中文字词编码、单次处理文档集的大小在1M以下。
4.5数据管理能力要求(针对软件系统)
略。
4.6 故障处理要求
报错:对于文本无法打开,保存时空间已满的情况,文本观点句识别工具会进行报错;对于输入格式不对的文本、非简体中文编码的文本,容量超过限制的文本等,文本观点句识别工具会进行报错;单个文本文档处理时间太长(超过五分钟),文本观点句识别工具也会报错。
4.7其他专门要求
暂无。
5. 运行环境规定
5.1 设备
一般用于个人、家庭或工作单位的个人计算机,无特殊要求。
5.2 支撑软件
1) 操作系统:windows2003及以上系统。
2) 数据库管理系统:暂不需要。
3) 其他支撑软件:txt文本编辑器
5.3 接口
 

以上是本题目部分介绍,若需要完整版或不符合您的要求,请联系客服QQ:840612233

上一篇:ARP攻击及防御技术研究任务书

下一篇:最后一页