Marc Olejak's picture

Marc Olejak

MarcGrumpyOlejak

·

AI & ML interests

On the practical low-cost level of ML playing around with german bureaucratic language and still uses Levenshtein.

Organizations

None yet

MarcGrumpyOlejak 's datasets 12

MarcGrumpyOlejak/gooaq_mt_german

Viewer • Updated Nov 24, 2025 • 3.01M • 98

MarcGrumpyOlejak/LCC_deu_news_1M_bt

Viewer • Updated Aug 6, 2025 • 17.4M • 69

MarcGrumpyOlejak/gooaq_mt_german_0_hard_negatives

Viewer • Updated Jul 30, 2025 • 623k • 10

MarcGrumpyOlejak/gooaq_mt_german_5_hard_negatives

Viewer • Updated Jul 30, 2025 • 2.08M • 46

MarcGrumpyOlejak/mmarco-de-distilled-scored

Viewer • Updated Jun 13, 2025 • 315k • 6

MarcGrumpyOlejak/germanrag-scored

Viewer • Updated Jun 10, 2025 • 3.36k • 8

MarcGrumpyOlejak/german-oasst1-qa-format-scored

Viewer • Updated Jun 10, 2025 • 10.4k • 7

MarcGrumpyOlejak/swim-ir-monolingual-de-scored

Viewer • Updated Jun 2, 2025 • 447k • 7

MarcGrumpyOlejak/slimorca_dedup_german_experimental-scored

Viewer • Updated Jun 2, 2025 • 322k • 14

MarcGrumpyOlejak/gpt-4-self-instruct-german-scored

Viewer • Updated Jun 2, 2025 • 10k • 9

MarcGrumpyOlejak/ultradistil-intel-orca-dpo-de-scored

Viewer • Updated Jun 2, 2025 • 5.92k • 7

MarcGrumpyOlejak/alpaca-gpt4_de-scored

Viewer • Updated Jun 2, 2025 • 50k • 6