物理上篇聚焦物理学科的客观题,如选择、填空、判断等。为教育智能化提供物理客观题的标准化数据支撑,可助力智能题库精准出题,帮助模型强化对物理基础知识点的辨析与判断能力,提升其在客观题场景下的答题准确性。
在数据质量方面,所有数据均通过严格的清洗、校验与标注流程,确保数据的准确性与规范性,并统一数据格式,为模型训练与教育应用提供高可靠性支撑。
本次开源以“教学-推理双赋能”为核心,通过全量开放、生态共建,构建可持续的数据应用生态。数据集紧密关联高等教育教学实际,确保数据的教育实用性与推理训练针对性,既满足教育信息化发展的迫切需求,又与大模型研发的实际场景紧密衔接,在持续的应用与反馈中,加速教育智能技术与大模型推理能力向实际场景落地跃迁,为教育数字化转型与AI模型创新发展夯实数据底座。
与传统数据集不同,我们不仅提供标准答案,更为每个问题配备了由先进大语言模型(LLM)多次独立生成的“采样答案”及其详尽的“思考链”(reasoning_content)。所有采样结果都经过了自动化评估流水线检验,尽量使得最终产出的数据在正确性、逻辑性和一致性上都达到高标准。
数据集采用 JSON Lines (.jsonl) 格式,每行是一个独立的JSON对象。
| 字段名 | 类型 | 说明 |
|---|---|---|
id | String | 唯一的记录标识符。由question的MD5值生成。 |
subject | String | 学科领域,例如:“物理”、“计算机科学”。 |
qtype | String | 题目类型,例如:“简答题”、“选择题”。 |
question | String | 问题描述,即题目的正文。 |
choices | Array<String> 或 null | 选项列表。对于非选择题,此字段为null。 |
answer | Array<String> | 标准答案。设计为数组以兼容多选题和答案较长的简答题。 |
explanation | String 或 null | 答案解析。对标准答案的官方解释或知识点说明。 |
sampling_results | Array<Object> | 核心字段,包含了对同一问题由LLM多次生成的结果以及对这些结果的评估。详见下文。 |
sampling_results 内部字段sampling_results 字段是一个数组,其中每个元素都是一个对象,代表一次完整的“模型生成-评估”流程。
| 字段名 | 类型 | 说明 |
|---|---|---|
content | String | 模型生成内容。LLM针对 question 生成的完整回答文本。其中,最终的核心答案通常用 \boxed{...} 格式包裹,并支持Markdown及LaTeX公式。 |
reasoning_content | String | 模型推理过程。记录了模型在生成 content 时的“思考链”(Chain-of-Thought),是本数据集的核心价值之一。 |
is_correct | Boolean | 正确性评估。这是一个由自动化审核脚本填充的布尔值。true 表示该条采样结果被判定为正确,false 表示被判定为错误。 |
[
{
"id": "198356f7c0807f574d8dd2c7994663d6",
"subject": "物理",
"qtype": "多选题",
"question": "当讨论透镜和镜子所成像的性质时,区分实像和虚像是非常重要的。下列哪几项准确描述了实像和虚像的区别?",
"choices": [
"A. 实像可以在屏幕上投射出来。",
"B. 虚像可以在屏幕上投射出来。",
"C. 实像是光线实际汇聚形成的。",
"D. 虚像是光线实际汇聚形成的。"
],
"answer": [
"A",
"C"
],
"explanation": "实像是光线实际汇聚形成的,因此它们可以在屏幕上投射出来。虚像是光线看起来从某一点发散出来的,但实际上并没有光线在那里汇聚,所以虚像不能被投射到屏幕上,但可以通过眼睛观察到。",
"sampling_results": [
{
"content": "首先,明确实像与虚像的核心区别: \n- 实像由**实际光线会聚**形成,**可以在屏幕上呈现**(如凸透镜成的倒立实像、小孔成像); \n- 虚像由**实际光线的反向延长线会聚**形成,**无法在屏幕上呈现**(如平面镜成的正立虚像、凸透镜成的放大虚像)。 \n\n逐一分析选项: \n- A:符合实像的性质,正确; \n- B:虚像不能在屏幕上投射,错误; \n- C:符合实像的定义,正确; \n- D:虚像不是实际光线会聚,错误。 \n\n\n\\boxed{AC}",
"reasoning_content": "用户现在需要解决这个关于实像和虚像区别的多选题。首先回忆一下实像和虚像的定义:实像是实际光线会聚而成的,所以能在屏幕上呈现;虚像是实际光线的反向延长线会聚形成的,不能在屏幕上呈现。然后看选项:A选项说实像可以在屏幕上投射,对的,因为实像实际会聚,能成在屏上;B选项虚像可以投射,错的,虚像不行;C选项实像是光线实际汇聚,对的;D选项虚像是实际汇聚,错的,虚像是反向延长线。所以正确的是A和C,连起来是AC?等一下,再确认:A对,C对,所以正确选项是AC?对,没错。",
"is_correct": true
},
{
"content": "要解决这个问题,需明确**实像与虚像的核心区别**:\n\n\n### 关键概念回顾 \n- **实像**:由**实际光线直接会聚**形成,能在光屏(或屏幕)上呈现(例如凸透镜成的倒立实像、小孔成像)。 \n- **虚像**:由**光线的反向延长线会聚**形成(实际光线并未真正交汇),**不能在光屏上呈现**(例如平面镜成的正立虚像、凸透镜作为放大镜时成的虚像)。 \n\n\n### 选项分析 \n- **A**:实像可以在屏幕上投射出来 → 正确(符合实像的核心特征)。 \n- **B**:虚像可以在屏幕上投射出来 → 错误(虚像无法用光屏承接)。 \n- **C**:实像是光线实际汇聚形成的 → 正确(实像的定义)。 \n- **D**:虚像是光线实际汇聚形成的 → 错误(虚像是反向延长线的“假想”汇聚)。 \n\n\n综上,正确选项为 **A** 和 **C**。\n\n\n\\boxed{AC}",
"reasoning_content": "\n首先,得回忆一下实像和虚像的定义。实像的特点是实际光线会聚而成的,能呈现在光屏上对吧?虚像是反射或者折射后的光线的反向延长线会聚形成的,不能呈现在光屏上。那看选项:A选项说实像能在屏幕投射,对的;B选项说虚像可以,错的;C选项说实像是实际光线汇聚,对的;D选项说虚像是实际汇聚,错的。所以正确的是A和C?等一下,再确认一下:实像比如小孔成像,或者凸透镜成的实像,确实能在屏幕上显示,因为是实际光线交点。虚像比如平面镜成的像,或者凸透镜当放大镜用的时候成的像,是反向延长线的交点,不能在屏幕上显示,只能用眼睛看。所以A对,B错;C对,D错。那正确选项是AC?",
"is_correct": true
},
{
"content": "要解决这个问题,需明确**实像与虚像的核心区别**:\n\n\n### 关键概念回顾 \n- **实像**:由**实际光线会聚**形成,能够在光屏(如白纸、屏幕)上呈现。 \n- **虚像**:由**实际光线的反向延长线“会聚”**形成(并非实际光线真正相交),无法在光屏上呈现。 \n\n\n### 选项分析 \n- **A**:实像可以在屏幕上投射出来 → 符合实像的性质,正确。 \n- **B**:虚像可以在屏幕上投射出来 → 虚像无法在光屏上呈现,错误。 \n- **C**:实像是光线实际汇聚形成的 → 符合实像的定义,正确。 \n- **D**:虚像是光线实际汇聚形成的 → 虚像由光线反向延长线形成,错误。 \n\n\n正确选项为 **A** 和 **C**。\n\n\\boxed{AC}",
"reasoning_content": "用户现在需要解决这个关于实像和虚像区别的多选题。首先,回忆一下实像和虚像的定义:实像是实际光线会聚而成的,所以能呈现在光屏上;虚像是实际光线的反向延长线会聚形成的,不能呈现在光屏上。然后看选项:A选项说实像可以在屏幕上投射,对的,因为实像实际会聚,能成在屏上。B选项说虚像可以,错的,虚像不行。C选项说实像是光线实际汇聚,对的,这是实像的本质。D选项说虚像是实际汇聚,错的,虚像是反向延长线。所以正确的是A和C,连接起来是AC。",
"is_correct": true
},
{
"content": "\\boxed{AC}",
"reasoning_content": "\n首先,我需要回忆实像和虚像的定义和区别。首先,实像的定义是光线实际会聚形成的像,所以能呈现在屏幕上,比如凸透镜成的实像(当物距大于焦距时)。然后虚像呢,是光线的反向延长线会聚形成的,不能呈现在屏幕上,比如平面镜成的像,还有凸透镜当物距小于焦距时成的放大虚像。\n\n现在看选项:A选项说实像可以在屏幕上投射出来,对的,因为实际光线会聚,所以能成像在屏上。B选项说虚像可以,这不对,虚像不行。C选项说实像是实际光线汇聚,对的,符合定义。D选项说虚像是实际汇聚,不对,虚像是反向延长线。所以正确的是A和C?等下,再确认一下:对,实像的两个特点就是实际光线会聚、能成在屏上;虚像相反,是反向延长线,不能成在屏上。所以选项A和C正确。那连接起来就是AC?",
"is_correct": true
},
{
"content": "\\boxed{AC}",
"reasoning_content": "用户现在需要解决这个关于实像和虚像区别的多选题。首先,回忆一下实像和虚像的定义:实像是实际光线会聚而成的,所以能呈现在光屏上;虚像是实际光线的反向延长线会聚而成的,不能呈现在光屏上。然后看选项:A选项说实像可以在屏幕投射,对的,因为实像实际会聚,能成像在屏上;B选项虚像可以投射,错,虚像不行;C选项实像是实际光线汇聚,对的;D选项虚像是实际汇聚,错,虚像是反向延长线。所以正确的是A和C,连接起来是AC。",
"is_correct": true
}
]
}
]本项目采用 MIT许可协议。
唯一要求:
本许可不提供任何担保,作者不对使用本数据集产生的任何问题负责。
如果您对该数据集有任何疑问,或在您的研究中使用了该数据集,欢迎通过 caoyanping@kupasai.com 或 dengsiwen@kupasai.com 与我们联系。