Podržani alati
Trenutno Domovina MCP poslužitelj nudi sljedeći alat za pretraživanje korpusa. Dodatni alati u izradi navedeni su pod „Planirano".
Aktivni alati
| Alat | Opis | Parametri |
|---|---|---|
search_podcasts |
Semantičko pretraživanje korpusa hrvatskih katoličkih i političkih podcasta. Vraća do 50 chunkova transkripta s ocjenom relevantnosti, imenom govornika, vremenom u epizodi i dubokim linkom na YouTube na točnu sekundu. Podržava hibridno pretraživanje (semantika + leksički filter) za vlastita imena gdje sami vektori imaju slabosti. |
query (string, obavezan): prirodno jezični upit, 2–500 znakova
limit (broj, neobavezan): 1–50, zadano 10 channel (string, neobavezan): slug kanala (npr. podcast_cuspajz)lexical_terms (popis stringova, neobavezan): hibridni filter — chunk mora sadržavati SVE navedene tokene; do 10 tokena |
Planirano (TBD)
Sljedeći alati su u planu ali nisu još implementirani na produkciji. Prati napredak na GitHub Issues.
| Alat | Opis | Status |
|---|---|---|
get_episode |
Dohvati metapodatke i sažetak pojedine epizode prema youtube_id-u. Vraća naslov, datum objave, govornike, popis poglavlja i link na cijeli transkript. |
planirano (Faza 2) |
get_speaker |
Dohvati profil govornika prema imenu — popis pojavljivanja po epizodama, glavne teme, link na entity resolution. Zahtijeva završetak ensemble speaker pipeline-a (TitaNet + pyannote-wespeaker34). | planirano (Faza 3) |
list_channels |
Popis aktivnih YouTube kanala u korpusu s metapodacima (ime, follower count, broj epizoda, zadnja sinkronizacija). | planirano (Faza 2) |
chat (Q&A) |
Cjelokupni Q&A cjevovod: tvoje pitanje → retrieval → reranker → Gemini 2.5 Flash generacija s citatima iz transkripta. Resursno zahtjevnija operacija — vlastiti rate-limit bazen (vidi Ograničenja). | planirano (Faza 2) |
Stil odgovora
Svi alati vraćaju strukturirani JSON unutar MCP content bloka tipa
text (JSON-stringified). Vremenski timestamp-i su u sekundama od
početka videa; datumi u YYYY-MM-DD formatu (ISO 8601). Hrvatska
slova zadržana su u UTF-8 bez transliteracije.