4位量化

  • llama.cpp:树莓派都能运行的类chatgpt项目

    曾经有一位名叫王大神的技术狂热者,他热衷于探索新的技术和挑战,尤其是在他的MacBook上。有一天,他听说了LLaMA模型,这是一个纯C/C++实现的深度学习模型,支持4位量化。这个模型在Apple silicon上通过ARM NEON进…

    2023年3月19日
    00