DOMOVINA.ai

Podržani alati

Trenutno Domovina MCP poslužitelj nudi sljedeći alat za pretraživanje korpusa. Dodatni alati u izradi navedeni su pod „Planirano".

Aktivni alati

AlatOpisParametri
search_podcasts Semantičko pretraživanje korpusa hrvatskih katoličkih i političkih podcasta. Vraća do 50 chunkova transkripta s ocjenom relevantnosti, imenom govornika, vremenom u epizodi i dubokim linkom na YouTube na točnu sekundu. Podržava hibridno pretraživanje (semantika + leksički filter) za vlastita imena gdje sami vektori imaju slabosti.
query (string, obavezan): prirodno jezični upit, 2–500 znakova
limit (broj, neobavezan): 1–50, zadano 10
channel (string, neobavezan): slug kanala (npr. podcast_cuspajz)
lexical_terms (popis stringova, neobavezan): hibridni filter — chunk mora sadržavati SVE navedene tokene; do 10 tokena

Planirano (TBD)

Sljedeći alati su u planu ali nisu još implementirani na produkciji. Prati napredak na GitHub Issues.

AlatOpisStatus
get_episode Dohvati metapodatke i sažetak pojedine epizode prema youtube_id-u. Vraća naslov, datum objave, govornike, popis poglavlja i link na cijeli transkript. planirano (Faza 2)
get_speaker Dohvati profil govornika prema imenu — popis pojavljivanja po epizodama, glavne teme, link na entity resolution. Zahtijeva završetak ensemble speaker pipeline-a (TitaNet + pyannote-wespeaker34). planirano (Faza 3)
list_channels Popis aktivnih YouTube kanala u korpusu s metapodacima (ime, follower count, broj epizoda, zadnja sinkronizacija). planirano (Faza 2)
chat (Q&A) Cjelokupni Q&A cjevovod: tvoje pitanje → retrieval → reranker → Gemini 2.5 Flash generacija s citatima iz transkripta. Resursno zahtjevnija operacija — vlastiti rate-limit bazen (vidi Ograničenja). planirano (Faza 2)

Stil odgovora

Svi alati vraćaju strukturirani JSON unutar MCP content bloka tipa text (JSON-stringified). Vremenski timestamp-i su u sekundama od početka videa; datumi u YYYY-MM-DD formatu (ISO 8601). Hrvatska slova zadržana su u UTF-8 bez transliteracije.