Calme-4x7B 是一个混合专家(Mixture of Experts, MoE)模型,集成了四个最先进的 Calme-7B 模型。从本质上来说,Calme-4x7B 由四个经过单独微调的 Calme-7B 模型构成,每个 token 对应两个专家。这种配置使得模型总参数超过 240 亿。Calme-4x7B 模型的显著特点是能够生成清晰度高、语气平和且连贯性强的文本。
# Use a pipeline as a high-level helper
from transformers import pipeline
pipe = pipeline("text-generation", model="MaziyarPanahi/Calme-4x7B-MoE-v0.1")
# Load model directly
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("MaziyarPanahi/Calme-4x7B-MoE-v0.1")
model = AutoModelForCausalLM.from_pretrained("MaziyarPanahi/Calme-4x7B-MoE-v0.1")| 指标 | Mistral-7B Instruct v0.2 | Calme-7B v0.1 | Calme-7B v0.2 | Calme-7B v0.3 | Calme-7B v0.4 | Calme-7B v0.5 | Calme-4x7B v0.1 | Calme-4x7B v0.2 |
|---|---|---|---|---|---|---|---|---|
| ARC | 63.14 | 67.24 | 67.75 | 67.49 | 64.85 | 67.58 | 67.15 | 76.66 |
| HellaSwag | 84.88 | 85.57 | 87.52 | 87.57 | 86.00 | 87.26 | 86.89 | 86.84 |
| TruthfulQA | 68.26 | 59.38 | 78.41 | 78.31 | 70.52 | 74.03 | 73.30 | 73.06 |
| MMLU | 60.78 | 64.97 | 61.83 | 61.93 | 62.01 | 62.04 | 62.16 | 62.16 |
| Winogrande | 77.19 | 83.35 | 82.08 | 82.32 | 79.48 | 81.85 | 80.82 | 81.06 |
| GSM8k | 40.03 | 69.29 | 73.09 | 73.09 | 77.79 | 73.54 | 74.53 | 75.66 |
以下额外信息可帮助您选择合适的 Calme-7B 模型:
| 使用场景类别 | 推荐的 Calme-7B 模型 | 原因 |
|---|---|---|
| 教育工具与学术研究 | Calme-7B v0.5 | 性能均衡,尤其在 TruthfulQA 中表现突出,准确性和知识覆盖面强。 |
| 常识推理与自然语言应用 | Calme-7B v0.2 或 Calme-7B v0.3 | 在 HellaSwag 中表现优异,擅长理解复杂细微的场景。 |
| 可信信息检索系统 | Calme-7B v0.5 | TruthfulQA 得分最高,能提供可靠的事实性信息。 |
| 数学教育软件 | Calme-7B v0.4 | GSM8k 性能最佳,适用于数值推理和数学问题求解。 |
| 上下文理解与歧义消除 | Calme-7B v0.5 | Winogrande 表现稳定,适合处理含上下文和代词歧义的文本。 |
我非常欣赏GGUF如何让大型语言模型(LLMs)在普通硬件上得到普及,更具体地说,是在没有任何加速硬件的个人电脑上。正因为如此,我致力于将我微调的所有模型进行转换和量化,让每个人都能使用它们!
<s>[INST] You are a helpful, respectful and honest assistant. Always answer as helpfully as possible, while being safe. Your answers should not include any harmful, unethical, racist, sexist, toxic, dangerous, or illegal content. Please ensure that your responses are socially unbiased and positive in nature.
If a question does not make any sense, or is not factually coherent, explain why instead of answering something not correct. If you don't know the answer to a question, please don't share false information.
describe about pros and cons of docker system. [/INST]
<s> [INST] Mark is faster than Mary, Mary is faster than Joe. Is Joe faster than Mark? Let's think step by step [/INST]
<s> [INST] explain step by step 25-4*2+3=? [/INST]
多语言能力:
<s> [INST] Vous êtes un assistant utile, respectueux et honnête. Répondez toujours de la manière la plus utile possible, tout en étant sûr. Vos réponses ne doivent inclure aucun contenu nuisible, contraire à l'éthique, raciste, sexiste, toxique, dangereux ou illégal. Assurez-vous que vos réponses sont socialement impartiales et de nature positive.
Si une question n'a pas de sens ou n'est pas cohérente d'un point de vue factuel, expliquez pourquoi au lieu de répondre quelque chose d'incorrect. Si vous ne connaissez pas la réponse à une question, veuillez ne pas partager de fausses informations.
Décrivez les avantages et les inconvénients du système Docker.[/INST]
<s>[INST] Ви - корисний, поважний та чесний помічник. Завжди відповідайте максимально корисно, будучи безпечним. Ваші відповіді не повинні містити шкідливого, неетичного, расистського, сексистського, токсичного, небезпечного або нелегального контенту. Будь ласка, переконайтеся, що ваші відповіді соціально неупереджені та мають позитивний характер.
Якщо питання не має сенсу або не є фактично послідовним, поясніть чому, замість того, щоб відповідати щось некоректне. Якщо ви не знаєте відповіді на питання, будь ласка, не діліться неправдивою інформацією.
Опис про переваги та недоліки системи Docker.[/INST]