moose-mini

Lots of code borrowed from Andrej Karpathy, Umar Jamil and Evin Tunador.

import torch
from huggingface_hub import hf_hub_download

moose = hf_hub_download(repo_id="namanbnsl/moose-mini", filename="model.py")
weights = hf_hub_download(repo_id="namanbnsl/moose-mini", filename="model.pth")
exec(open(moose).read())

params = ModelArgs()
model = Moose(params)
model.load_state_dict(torch.load(weights))
model.to(params.device)

print(model.generate("Once upon a time, there was a little car named Beep."))

Only trained on 100m tokens
Uses llama architecture

Github

huggingface 🤗

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
README.md		README.md
model.py		model.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

moose-mini

About

Releases

Packages

Languages

namanbnsl/moose-mini

Folders and files

Latest commit

History

Repository files navigation

moose-mini

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages