HuggingFace镜像/Calme-4x7B-MoE-v0.2
模型介绍文件和版本分析
下载使用量0

MaziyarPanahi/Calme-4x7B-MoE-v0.2

模型说明

Calme-4x7B 是一个混合专家(Mixture of Experts, MoE)模型,整合了四个最先进的 Calme-7B 模型。本质上,Calme-4x7B 由四个经过单独微调的 Calme-7B 模型组成,每个 token 有两个专家。这种配置使得总参数超过 240 亿。Calme-4x7B 模型的显著特点是能够生成具有卓越清晰度、平和性和连贯性的文本。

使用方法

# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("text-generation", model="MaziyarPanahi/Calme-4x7B-MoE-v0.2")

# Load model directly
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("MaziyarPanahi/Calme-4x7B-MoE-v0.2")
model = AutoModelForCausalLM.from_pretrained("MaziyarPanahi/Calme-4x7B-MoE-v0.2")

评估

指标Mistral-7B Instruct v0.2Calme-7B v0.1Calme-7B v0.2Calme-7B v0.3Calme-7B v0.4Calme-7B v0.5Calme-4x7B v0.1Calme-4x7B v0.2
ARC63.1467.2467.7567.4964.8567.5867.1576.66
HellaSwag84.8885.5787.5287.5786.0087.2686.8986.84
TruthfulQA68.2659.3878.4178.3170.5274.0373.3073.06
MMLU60.7864.9761.8361.9362.0162.0462.1662.16
Winogrande77.1983.3582.0882.3279.4881.8580.8281.06
GSM8k40.0369.2973.0973.0977.7973.5474.5375.66

以下额外信息可帮助您选择合适的 Calme-7B 模型:

使用场景类别推荐的 Calme-7B 模型原因
教育工具与学术研究Calme-7B v0.5性能均衡,尤其在 TruthfulQA 中表现突出,准确性和知识覆盖度强。
常识推理与自然语言应用Calme-7B v0.2 或 Calme-7B v0.3在 HellaSwag 中表现优异,擅长理解复杂细微的场景。
可信信息检索系统Calme-7B v0.5在 TruthfulQA 中得分最高,表明其能提供可靠的事实性信息。
数学教育软件Calme-7B v0.4在 GSM8k 中表现最佳,适用于数值推理和数学问题求解。
上下文理解与歧义消除Calme-7B v0.5在 Winogrande 中表现稳定,适合处理含上下文和代词歧义的文本。

量化模型

我非常欣赏GGUF能够推动大型语言模型(LLMs)在普通硬件上的普及应用,更具体地说,是在没有任何加速硬件的个人电脑上。正因为如此,我致力于将我微调的所有模型进行转换和量化,以便让每个人都能使用它们!

  • GGUF(2/3/4/5/6/8位):MaziyarPanahi/Calme-4x7B-MoE-v0.2-GGUF

示例

<s>[INST] You are a helpful, respectful and honest assistant. Always answer as helpfully as possible, while being safe.  Your answers should not include any harmful, unethical, racist, sexist, toxic, dangerous, or illegal content. Please ensure that your responses are socially unbiased and positive in nature.

If a question does not make any sense, or is not factually coherent, explain why instead of answering something not correct. If you don't know the answer to a question, please don't share false information.

describe about pros and cons of docker system. [/INST]
显示响应
显示回复
<s> [INST] Mark is faster than Mary, Mary is faster than Joe. Is Joe faster than Mark? Let's think step by step [/INST]
展示回复
展示回复
<s> [INST] explain step by step 25-4*2+3=? [/INST]
显示回复

多语言能力:

<s> [INST] Vous êtes un assistant utile, respectueux et honnête. Répondez toujours de la manière la plus utile possible, tout en étant sûr. Vos réponses ne doivent inclure aucun contenu nuisible, contraire à l'éthique, raciste, sexiste, toxique, dangereux ou illégal. Assurez-vous que vos réponses sont socialement impartiales et de nature positive.

Si une question n'a pas de sens ou n'est pas cohérente d'un point de vue factuel, expliquez pourquoi au lieu de répondre quelque chose d'incorrect. Si vous ne connaissez pas la réponse à une question, veuillez ne pas partager de fausses informations.

Décrivez les avantages et les inconvénients du système Docker.[/INST]
显示回复
显示回复
<s>[INST] Ви - корисний, поважний та чесний помічник. Завжди відповідайте максимально корисно, будучи безпечним. Ваші відповіді не повинні містити шкідливого, неетичного, расистського, сексистського, токсичного, небезпечного або нелегального контенту. Будь ласка, переконайтеся, що ваші відповіді соціально неупереджені та мають позитивний характер.

Якщо питання не має сенсу або не є фактично послідовним, поясніть чому, замість того, щоб відповідати щось некоректне. Якщо ви не знаєте відповіді на питання, будь ласка, не діліться неправдивою інформацією.

Опис про переваги та недоліки системи Docker.[/INST] 
显示响应