urdu_ghazals_rekhta Unduh - urdu_ghazals_rekhta Kode Sumber Download

urdu_ghazals_rekhta

Kode Sumber AI

1.0.0

Unduh

Dataset diatur sebagai penulis-> [en, ur, hai] -> ghazal/puisi

[en, ur, hai] menandakan transllieration dan urdu bahasa Inggris, teks hindi

Mengapa ini menarik? Urdu adalah bahasa sumber daya rendah di NLP. Dibandingkan dengan bahasa Inggris, yang dapat memiliki ratusan ribu artikel yang beredar di internet, tidak ada banyak konten untuk bahasa Urdu, untuk melatih model bahasa ML.

Ghazal adalah bentuk puisi yang populer di Asia Selatan.

Dalam hal NLP , ini memberikan kemungkinan yang menarik untuk pengujian model bahasa di masa depan.

Sumber: https://en.wikipedia.org/wiki/ghazal

Ghazal adalah puisi pendek yang terdiri dari bait berima, yang disebut Sher atau Bayt.
Sebagian besar ghazal memiliki antara tujuh dan dua belas shers. Agar sebuah puisi dianggap sebagai ghazal sejati, ia harus memiliki tidak kurang dari lima bait.
Hampir semua ghazal membatasi diri pada kurang dari lima belas bait (puisi yang melebihi panjang ini lebih akurat dianggap sebagai qasidas). Koplet ghazal berakhir dengan pola berirama yang sama dan diharapkan memiliki meter yang sama.
Keunikan ghazal muncul dari sajaknya dan menahan aturan, disebut sebagai 'qaufiyaa' dan 'radif' masing -masing.
Setiap SHER mandiri dan independen dari yang lain, berisi ekspresi lengkap dari suatu ide.

Saya ingin menyoroti poin penting di momement ini. 4MB data teks tidak ada apa -apa dibandingkan dengan apa yang sebenarnya dibutuhkan model transformator.

Dataset perayapan umum adalah gudang raksasa data teks gratis dalam lebih dari 40 bahasa. Jika Anda benar -benar ingin melatih model transformator dari awal, Anda akan memerlukan data dalam urutan jutaan file teks. Dan untuk itu akan lebih baik untuk memulai dengan salah satu alat data besar ini.

================================================

Semua kredit data termasuk dalam pekerjaan luar biasa yang dilakukan oleh Rekhta Foundation . Tautan: https://www.rekhta.org/

Data telah diuraikan ke dalam bahasa Urdu, Hindi, dan bahasa Inggris berkat halaman web mereka yang luar biasa. Pertimbangkan untuk mendukung mereka untuk pekerjaan hebat mereka dalam mendorong bahasa Urdu.

Kredit kepada penulis ini untuk kreasi asli mereka yang luar biasa:

'mirza-ghalib','allama-iqbal','faiz-ahmad-faiz','sahir-ludhianvi','meer-taqi-meer', 'dagh-dehlvi','kaifi-azmi','gulzar','bahadur-shah-zafar','parveen-shakir', 'Jaan-Nisar-Akhtar', 'Javed-Akhtar', 'Jigar-Moradabadi', 'Jaun-Eliya', 'Ahmad-Faraz', 'Meer-Walees', 'Mohsin-Naqvi', 'Firaq-Gorakhpuri', 'Fahmmmmi', 'Fahmmm', 'Fahmmam', 'Fahmmmi', 'Fahmmmi', 'Fahmmmi' 'Waseem-Barelvi', 'Akbar-Allahabadi', 'Altaf-Hussain-Hali', 'Ameer-Khusrau', 'Naji-Shakir', 'Naseer-Turabi', 'Nazm-Tabatabai', 'nida-jazli', 'noon-rashid', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab', 'hab-tabatabai

================================================

Jika Anda ingin memperpanjang ukuran dataset ini, lakukan garpu repositori ini. Ada ruang lingkup perbaikan karena saat ini parsing sederhana ini hanya melihat daftar penulis yang dikuratori. Mungkin ada cara yang lebih baik untuk mengotomatisasi tugas.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-10
ukuran 1.94MB
Berasal dari Github

Aplikasi Terkait

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Mesin analisis data Lihua versi gratis 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua