一种可训练的知识图谱嵌入模型,为案例 2025-137857 编码统一证据超图。
该模型对一个统一超图进行编码,将金融交易、邮件通信、法律证据和实体关系链接到单一的可训练知识表示中。
| 组件 | 详情 |
|---|---|
| 节点嵌入 | 128 维结构 + 256 维文本 |
| 隐藏维度 | 256 |
| 文本编码器 | 2 层 Transformer,4 个注意力头 |
| 图注意力 | 2 层 GAT,4 个注意力头 |
| 链接预测器 | 带边缘排序损失的 2 层 MLP |
| 总参数 | 36,023,937 |
| 指标 | 数量 |
|---|---|
| 总节点数 | 300,831 |
| 总边数 | 14,658 |
| 交叉链接数 | 3,644 |
| 实体数 | 16 |
| 邮件数 | 199,205 |
| 金融文档数 | 12,103 |
| 时间线事件数 | 59,955 |
| LEX 方案数 | 13 |
| 法律文件数 | 5 |
| 子系统 | 节点数 |
|---|---|
| Core (Entities) | 16 |
| Fincosys (Financial) | 101,429 |
| Comcosys (Communications) | 199,205 |
| RevStream1 (Evidence) | 150 |
| Ad-Res-J7 (Legal) | 31 |
该模型可在链接预测任务上进行微调:
from model.unicosys_model import UnicosysHypergraphModel, UnicosysConfig
model = UnicosysHypergraphModel.from_pretrained("hyperholmes/unicosys-hypergraph")
# ... prepare training data ...
# model.forward(node_ids, node_type_ids, subsystem_ids, edge_index, edge_type_ids,
# pos_edge_index=pos, neg_edge_index=neg, labels=labels)model.safetensors — 模型权重config.json — 模型配置graph_data.safetensors — 编码后的图张量(节点、边)tokenizer.json — 用于节点标签的字符级分词器node_id_mapping.json — 节点 ID 字符串到整数索引的映射model_summary.json — 精简统计摘要由 Unicosys 智能流水线生成。