Model Dolphin Llama 3, sebuah varian yang tidak disensor dari model Llama 3 yang dikembangkan oleh Meta AI, telah muncul sebagai tonggak penting dalam evolusi model bahasa besar (LLM). Model ini telah disesuaikan untuk menghasilkan konten yang kurang disensor, mendorong batasan dalam generasi teks dan memicu diskusi tentang keseimbangan antara kebebasan berekspresi dan penggunaan AI yang bertanggung jawab.
Fitur Utama Dolphin Llama 3 70B:
- Lebih kuat dan fleksibel dibandingkan model Llama-3.1-8B-Instruct yang telah dibobol
- Pengalaman LLM yang tidak disensor
- Tersedia di Anakin.AI! Cukup kunjungi https://app.anakin.ai/, klik opsi "Chats" di panel kiri.

Dan pilih Opsi Dolphin Llama 3.1 8B Instruct untuk melakukan obrolan tanpa batas dengan LLM secara online!


Bagaimana Dolphin-2.9-Llama-3-8b Dilatih
Dolphin Llama 3 dibangun di atas arsitektur model Llama 3 asli, yang merupakan model bahasa berbasis transformer dengan 7,5 miliar parameter. Model ini menggunakan arsitektur hanya decoding, mirip dengan GPT-3, dan dilatih pada kumpulan data beragam dari halaman web, buku, dan artikel.
Proses fine-tuning untuk Dolphin Llama 3 melibatkan pelatihan model pada dataset yang disusun dengan cermat yang mencakup konten yang kurang disensor. Dataset ini dikompilasi dari berbagai sumber, seperti posting media sosial, diskusi forum, dan platform konten yang dihasilkan pengguna. Komposisi dan ukuran tepat dari dataset fine-tuning tidak diungkapkan untuk menjaga integritas model.
Ingin tahu bagaimana cara melatih model Llama 3 sendiri? Baca artikel kami untuk mengetahuinya!
Benchmark Dolphin-2.9-Llama-3-8b
Dolphin-2.9-Llama-3-8b telah menunjukkan kinerja mengesankan di berbagai tugas pemrosesan bahasa alami. Dalam benchmark SuperGLUE, yang mengevaluasi model pada berbagai tugas pemahaman bahasa, Dolphin Llama 3 mencapai skor rata-rata 89,2, melampaui baseline manusia 89,0.
Dalam bidang generasi teks, Dolphin Llama 3 telah menunjukkan kemampuan luar biasa. Model ini dapat menghasilkan teks yang koheren dan relevan secara kontekstual berdasarkan prompt yang diberikan, bahkan ketika prompt tersebut mengandung topik yang berpotensi sensitif atau kontroversial. Kemampuan ini untuk menghasilkan konten yang kurang disensor membedakan Dolphin Llama 3 dari rekan-rekannya yang lebih terbatas.
Berikut adalah tabel benchmark untuk model Dolphin-2.9-Llama-3-8b:
Benchmark | Skor |
---|---|
MMLU | 71.4% |
HellaSwag | 83.1% |
PIQA | 83.6% |
ARC (Tantangan) | 75.0% |
ARC (Mudah) | 87.3% |
OpenBookQA | 78.8% |
Model Dolphin-2.9-Llama-3-8b menunjukkan kinerja yang kuat di berbagai benchmark, termasuk pemahaman bahasa multi-tugas (MMLU), penalaran akal sehat (HellaSwag, PIQA), dan menjawab pertanyaan (ARC, OpenBookQA).
Untuk menjalankan Dolphin-2.9-Llama-3-8b secara lokal, Anda dapat menggunakan file model format GGML yang tersedia di repositori Hugging Face. File GGML memungkinkan inferensi CPU dan GPU menggunakan alat seperti llama.cpp dan perpustakaan serta UI yang kompatibel.
Cara Menjalankan Dolphin-2.9-Llama-3-8b Secara Lokal
Berikut adalah langkah-langkah untuk menjalankan Dolphin-2.9-Llama-3-8b secara lokal:
Langkah 1. Instal llama.cpp atau perpustakaan/UI yang kompatibel yang mendukung format GGML, seperti KoboldCpp, LoLLMS Web UI, LM Studio, text-generation-webui, ctransformers, atau llama-cpp-python.
Langkah 2. Unduh file model GGML untuk Dolphin-2.9-Llama-3-8b dari repositori Hugging Face. Beragam opsi kuantisasi tersedia, seperti model 4-bit (q4_1, q4_K_M, q4_K_S) dan model 5-bit (q5_0, q5_1, q5_K_M).
Langkah 3. Siapkan perpustakaan/UI yang dipilih dan konfigurasikan untuk menggunakan file model GGML yang telah diunduh.
Langkah 4. Jalankan model secara lokal menggunakan antarmuka atau API dari perpustakaan/UI. Anda dapat memberikan prompt dan menghasilkan teks berdasarkan kemampuan model.
Misalnya, menggunakan llama.cpp, Anda dapat memuat model dan menghasilkan teks dengan kode berikut:
llm = AutoModelForCausalLM.from_pretrained("TheBloke/Dolphin-Llama-13B-GGUF", model_file="dolphin-llama-13b.Q4_K_M.gguf", model_type="llama", gpu_layers=50)
print(llm("AI akan"))
Alternatif, Anda dapat menggunakan Ollama untuk menjalankan Dolphin-2.9-Llama-3-8b secara lokal dengan 1 baris kode:
ollama run dolphin-llama3

Dolphin-2.9-Llama-3-8b: Apa yang Dapat Anda Lakukan dengan Llama 3 yang Tidak Disensor
Dolphin Llama 3 memiliki potensi untuk merevolusi berbagai domain, termasuk penulisan kreatif, generasi konten, dan asisten virtual. Kemampuan model untuk menghasilkan konten yang kurang disensor membuka kemungkinan baru untuk interaksi manusia-AI yang lebih alami dan ekspresif.
- Dalam bidang penulisan kreatif, Dolphin Llama 3 dapat berfungsi sebagai alat yang kuat bagi penulis dan penulis skenario, membantu mereka menghasilkan alur cerita, dialog, dan deskripsi karakter yang beragam dan menarik. Sifat model yang tidak disensor memungkinkan penciptaan konten yang lebih autentik dan realistis.
- Untuk generasi konten, Dolphin Llama 3 dapat digunakan untuk menghasilkan artikel, posting blog, dan konten media sosial yang berbentuk resonansi dengan audiens target. Kemampuan model untuk memahami dan menghasilkan konten yang kurang disensor memungkinkan penciptaan konten yang lebih mudah dipahami dan berdampak.
- Dalam ranah asisten virtual, Dolphin Llama 3 dapat meningkatkan pengalaman pengguna dengan memberikan respons yang lebih alami dan relevan secara kontekstual. Dengan menghasilkan konten yang kurang disensor, model ini dapat terlibat dalam percakapan yang lebih nyata dan manusiawi, meningkatkan kepuasan dan keterlibatan pengguna.
- Selain itu, upaya penelitian sedang dilakukan untuk mengembangkan mekanisme pemantauan dan penyaringan yang lebih maju untuk memastikan penggunaan model yang bertanggung jawab. Ini melibatkan penggunaan teknik pembelajaran mesin untuk secara otomatis mendeteksi dan menandai konten yang berpotensi berbahaya, memungkinkan intervensi dan penyesuaian secara real-time.
Kesimpulan
Dolphin Llama 3 mewakili kemajuan signifikan di bidang model bahasa besar, menawarkan pendekatan yang kurang disensor terhadap generasi teks. Meskipun sifat model yang tidak disensor telah menimbulkan kekhawatiran etis, pengembang telah menerapkan langkah-langkah pengaman dan panduan untuk memastikan penggunaan yang bertanggung jawab.
Dengan kinerjanya yang mengesankan dan potensi aplikasi di berbagai domain, Dolphin Llama 3 siap membentuk masa depan interaksi manusia-AI. Saat penelitian dan pengembangan terus berlanjut, penting untuk mencapai keseimbangan antara mendorong inovasi dan mengatasi implikasi etis dari model bahasa yang tidak disensor.
Saat kita menjelajahi perbatasan baru konten yang dihasilkan oleh AI ini, penting untuk terlibat dalam diskusi terbuka dan transparan tentang peran model bahasa dalam masyarakat. Dengan bekerja sama, peneliti, pengembang, dan pemangku kepentingan dapat memanfaatkan kekuatan model seperti Dolphin Llama 3 untuk menciptakan ekosistem AI yang lebih inklusif, ekspresif, dan bertanggung jawab.