Unicosys Hypergraph 知识模型

一种可训练的知识图谱嵌入模型，为案例 2025-137857 编码统一证据超图。

模型描述

该模型对一个统一超图进行编码，将金融交易、邮件通信、法律证据和实体关系链接到单一的可训练知识表示中。

架构

组件	详情
节点嵌入	128 维结构 + 256 维文本
隐藏维度	256
文本编码器	2 层 Transformer，4 个注意力头
图注意力	2 层 GAT，4 个注意力头
链接预测器	带边缘排序损失的 2 层 MLP
总参数	36,023,937

知识图谱统计

指标	数量
总节点数	300,831
总边数	14,658
交叉链接数	3,644
实体数	16
邮件数	199,205
金融文档数	12,103
时间线事件数	59,955
LEX 方案数	13
法律文件数	5

子系统

子系统	节点数
Core (Entities)	16
Fincosys (Financial)	101,429
Comcosys (Communications)	199,205
RevStream1 (Evidence)	150
Ad-Res-J7 (Legal)	31

训练

该模型可在链接预测任务上进行微调：

from model.unicosys_model import UnicosysHypergraphModel, UnicosysConfig

model = UnicosysHypergraphModel.from_pretrained("hyperholmes/unicosys-hypergraph")
# ... prepare training data ...
# model.forward(node_ids, node_type_ids, subsystem_ids, edge_index, edge_type_ids,
#               pos_edge_index=pos, neg_edge_index=neg, labels=labels)

文件

model.safetensors — 模型权重
config.json — 模型配置
graph_data.safetensors — 编码后的图张量（节点、边）
tokenizer.json — 用于节点标签的字符级分词器
node_id_mapping.json — 节点 ID 字符串到整数索引的映射
model_summary.json — 精简统计摘要

来源

由 Unicosys 智能流水线生成。

Unicosys Hypergraph 知识模型

一种可训练的知识图谱嵌入模型，为案例 2025-137857 编码统一证据超图。

模型描述

该模型对一个统一超图进行编码，将金融交易、邮件通信、法律证据和实体关系链接到单一的可训练知识表示中。

架构

组件	详情
节点嵌入	128 维结构 + 256 维文本
隐藏维度	256
文本编码器	2 层 Transformer，4 个注意力头
图注意力	2 层 GAT，4 个注意力头
链接预测器	带边缘排序损失的 2 层 MLP
总参数	36,023,937

知识图谱统计

指标	数量
总节点数	300,831
总边数	14,658
交叉链接数	3,644
实体数	16
邮件数	199,205
金融文档数	12,103
时间线事件数	59,955
LEX 方案数	13
法律文件数	5

子系统

子系统	节点数
Core (Entities)	16
Fincosys (Financial)	101,429
Comcosys (Communications)	199,205
RevStream1 (Evidence)	150
Ad-Res-J7 (Legal)	31

训练

该模型可在链接预测任务上进行微调：

from model.unicosys_model import UnicosysHypergraphModel, UnicosysConfig

model = UnicosysHypergraphModel.from_pretrained("hyperholmes/unicosys-hypergraph")
# ... prepare training data ...
# model.forward(node_ids, node_type_ids, subsystem_ids, edge_index, edge_type_ids,
#               pos_edge_index=pos, neg_edge_index=neg, labels=labels)

文件

model.safetensors — 模型权重
config.json — 模型配置
graph_data.safetensors — 编码后的图张量（节点、边）
tokenizer.json — 用于节点标签的字符级分词器
node_id_mapping.json — 节点 ID 字符串到整数索引的映射
model_summary.json — 精简统计摘要

来源

由 Unicosys 智能流水线生成。