大学生毕业论文(设计)管理系统算法及模型备案公示说明

为依法保障用户对大学生毕业论文(设计)管理系统的智能报告、选题分析和智能生成答辩PPT功能的算法及模型服务的基本原理、目的意图和主要运行机制等的知情权,告知用户知网个人查重服务答辩服务及评审智检功能提供的算法及模型服务的备案情况,我们制定本《大学生毕业论文(设计)管理系统算法及模型备案公示说明》,帮助用户了解在使用智能报告、选题分析和智能生成答辩PPT功能的过程中我们如何通过算法及模型技术向用户提供信息和服务,充分保障用户的合法权益。

大学生毕业论文(设计)管理系统的选题分析、智能报告和智能生成答辩PPT功能接入了知网中华知识大模型算法-1、知网中华知识大模型算法-2、中华知识大模型、达摩院交互式多能型合成算法、通义千问大规模语言模型。我们在下文中将对知网中华知识大模型算法-1、知网中华知识大模型算法-2、中华知识大模型、达摩院交互式多能型合成算法、通义千问大规模语言模型的备案情况分别进行公示说明。

一.算法

1. 知网中华知识大模型算法-1

1.1 算法名称

知网中华知识大模型算法-1

1.2 算法基本原理

知网中华知识大模型算法通过对大规模训练数据进行预训练,建模了大量蕴含在自然语言中的知识,在预训练模型的基础上采用了有监督微调、人类反馈的强化学习和 Prompt 机制等技术,使得大模型可以通过对话方式提供合适的内容,构建一种具备知识增强、检索增强和对话增强技术特色的模型。

1.3 算法运行机制

(1)客户端输入:输入文本形式的提问。

(2)输入预处理:清理和标准化输入内容,例如去除不必要的字符。

(3)内容审核:使用文本审核模型对输入进行过滤,确保无违规内容。

(4)问题解析与回答生成:大模型根据用户提问生成回复。。

(5)输出内容过滤:对生成内容进行风险审核,确保内容合规。

(6)输出格式化:将回复格式化为适当的文本形式。

(7)算法结果输出:展示问答结果。

1.4 算法应用场景

智能问答、智能文本创作、办公文档处理等

1.5 算法目的意图

(1) 辅助完成公文的格式编排、内容比对等任务,自动化处理琐碎工作,减轻工作人员的负担,同时保证公文内容符合规范和标准。

(2) 通过算法实现文献的精准问答、文献综述的自动生成、文献阅读报告的自动撰写等功能,帮助用户梳理研究脉络,发现研究空白点,提高研究效率。同时,提供学术规范知识库问答和单篇文章对话等功能,辅助用户规范写作,提高文献阅读效率。

1.6 备案编号

网信算备110108054528501240035号

2.知网中华知识大模型算法-2

2.1 算法名称

知网中华知识大模型算法-2

2.2 算法基本原理

知网中华知识大模型算法通过对大规模训练数据进行预训练,建模了大量蕴含在自然语言中的知识,在预训练模型的基础上采用了有监督微调、人类反馈的强化学习和 Prompt 机制等技术,使得大模型可以通过对话方式提供合适的内容,构建一种具备知识增强、检索增强和对话增强技术特色的模型。

2.3 算法运行机制

(1)客户端输入:输入文本形式的提问。

(2)输入预处理:清理和标准化输入内容,例如去除不必要的字符。

(3)内容审核:使用文本审核模型对输入进行过滤,确保无违规内容。

(4)问题解析与回答生成:大模型根据用户提问生成回复。

(5)输出内容过滤:对生成内容进行风险审核,确保内容合规。

(6)输出格式化:将回复格式化为适当的文本形式。

(7)算法结果输出:展示问答结果。

2.4 算法应用场景

文献知识问答、文本摘要、智能写作等。

2.5 算法目的意图

以知识为中心,服务于学术研究等知识密集型智能知识服务场景,典型的业务场景如文献知识问答、文本摘要、智能写作等。旨在帮助学术研究人员更好地处理海量学术数据、提取有价值的信息、提高研究效率和准确性。

2.6 备案编号

网信算备110108054528501240043号

3.达摩院交互式多能型合成算法

3.1 算法名称

达摩院交互式多能型合成算法

3.2算法基本原理

该算法是一个专门响应人类指令的交互式多能型AI技术。其基于生成式大模型技术、自然语言处理技术,通过海量文本的深度学习大模型预训练,陆续会实现撰写邮件、列举提纲、灵感写作、方案和建议回复等算法能力。通过大模型的语义理解能力,模型无需复杂的输入处理模块,即有能力理解用户的不同需求,产出写诗、讲故事、编剧本、机器翻译、表格生成、代码写作等不同格式的恰当回复,并可进一步延伸到多模态任务场景,完成图像处理&生成、语音处理&合成、办公文档处理等任务。

3.3.算法运行机制

(1)用户给定一段文本、一段代码、一张图片、一段音频、一段视频、或一个办公文档文件,作为自己输入;

(2)输入数据经过安全过滤判断是否通过安全筛选,若不通过则不进行数据生成,直接返回兜底安全结果;

(3)将各种模态输入内容,输入到预训练模型中,根据用户输入内容指令,生成对应态的输出数据(可能为文本、代码、图片、音频模态);

(4)输出数据经过安全过滤判断是否通过安全筛选,通过则返回结果;

(5)将生成的文本、代码、图片或音频输出,并根据需要进行后处理。生成的图像可能需要进行一些修剪、缩放或调整分辨率、等操作,以得到该轮交互最终的输出结果;

(6)继续进行下一轮交互,回到第1步。

3.4 算法应用场景

智能文本创作、机器翻译、表格生成、图像合成、语音合成、办公文档处理等使用场景。

3.5 算法目的意图

可以通过文本指令调用预训练模型,产出写诗、讲故事、编剧本、机器翻译、表格生成代码写作等不同格式的恰当回复,满足用户相关创作、办公、知识获取等需求;进一步可以通过文本指令,调用预训练模型,完成图像生成和语音合成,帮助用户解决多模态任务场景需求;同时,算法支持输入代码、图像、语音和办公文档,输出文本,从而支持代码辅助、看图说话、视觉问答、语音转文字、办公文档信息处理等目的。

3.6备案编号

网信算备330110507206401230035号

二、大模型

1. 中华知识大模型

1.1 模型名称

中华知识大模型

1.2 模型备案编号

Beijing-ZhongHuaZhiShi-202404280011

1.3 模型应用场景

中华知识大模型服务于学术研究等知识密集型各智能知识服务场景,典型的业务场景如文献知识问答、文本摘要、智能写作等。

2. 通义千问大规模语言模型

2.1模型名称

通义千问大规模语言模型

2.2模型备案编号

ZheJiang-TongYiQianWen-20230901

2.3模型应用场景

通义千问大规模语言模型主要用于CNKI AI内意图识别、文本创作、文档解读等功能。