Práce:Univerzální vyhledávání pro portálové rozhraní (DP)

Z HelpDesk
Verze z 26. 2. 2021, 16:44, kterou vytvořil Svamberg (diskuse | příspěvky) (aktualizace)
(rozdíl) ← Starší verze | zobrazit aktuální verzi (rozdíl) | Novější verze → (rozdíl)

Zadání vypsal: Ing. Lukáš Valenta
Rezervováno: ne

Cíl práce stručně a jasně: Do portálového rozhraní ZČU (a dalších cca 15-ti portálů škol využívajících IS/STAG) dodělat fulltextové vyhledávání, které bude umět procházet obsah všech podporovaných, v portálu nainstalovaných aplikací.

IS/STAG obecne a jeho část “Prohlížení” konkretne obsahuje velke mnozstvi informaci, informace jsou ale izolovane a nelze jednoduse najit a zkombinovat informaci z ruznych sekci najednou (napr. predmety + st. plany). Minimalne pro prohlizeni to drive za nas z velke casti delal Google, ale Prohlizeni, na zacatku koncipovane jako otevrene, se postupne zavira (nejen kvuli GDPR, je to obecny trend). Kazda skola ma navic jine pozadavky na verejne zobrazovana data. Hledame tedy moznost, jak nasim uzivatelum (prihlasenym) zpristupnit “fulltextove” vyhledavani v IS/STAG. S dostatecne jednoduchym GUI (zadne slozite filtry jako ve stavajicim Prohlizeni), v prostredi, ktere mame pod kontrolou (portal.zcu.cz).

Co vsechno lze prohledavat (skupiny dat, dostupne datasety):

  • Informace dostupné v prohlížení IS/STAG:
    • Programy, obory, plány (+ segmenty, bloky, předměty a vzájemné vazby).
    • Předměty (a vazby na termíny, rozvrhy)
    • Učitelé (a vazby na předměty, termíny, programy/plány)
    • Zkouškové termíny (volitelně)
    • Zkouškové termíny, kalendář (volitelně)
  • Přijímací řízení, programy a obory nabízené v e-přihlášce
  • Portálové rozhraní jako takové - alespoň vyhledávat v názvech jednotlivých stránek
  • Hodnocení kvality výuky (vazba na předměty)
  • Courseware - textový obsah + dokumenty (vazba na předměty)
  • Semestralni prace (vazba na predmety)
  • Personalizované informace (stipendia, vlastní rozvrh a jeho historie, známky)

Cílem je vytvoření prototypu aplikace vyhledávání a prezentace výsledků (detail výsledku vyhledávání je obvykle již k dispozici na nějakém URL [např. prohlížení]). Není nezbytne nutne zahrnout vsechny konkretni entity z jedne skupiny / datasetu (napr. vsechny informace z Prohlizeni). Staci jedna typova, tedy napriklad prohledavani predmetu a jeho vazby (opet staci typove jedna, s naznacenym postupem, jak se zpracuji ostatni informace do hloubky).

Aplikace by mela ale obsahovat prototyp integrace vsech popsanych skupin dat / datasetu, tak aby bylo mozne aplikaci dale rozvíjet podle daneho prototypu.

Pozor na to, ze ve vysledcich vyhledavani by se mely spojit informace verejne dostupne a personalizovane. Ty personalizovane samozrejme nesmi byt dostupne jinym uzivatelum.

Technologie

Pouzite technologie jsou plne na resiteli. Pozadavky a podmínky zadavatele jsou:

  • integrovatelnost s IS/STAG a Portalem ZCU (vyhledavani bude soucasti portalu), tedy zjednodusene receno server side java aplikace.
  • Data, ktera chceme prohledavat, jsou ulozena v DB Oracle a pristup k nim je mozny:
    • na DB úrovni (existuje řada “selectu” i java objektu, ktere je pouzivaji).
    • Web Services (REST / SOAP)
    • případně použít web scraping.

Zpusob reseni neni soucasti zadani - jako jeden z vystupu prace se ocekava doporuceni vyhovujicich nastroju, knihoven, postupu a best practices. Dalsim vystupem bude funkcni vyhledavani v alespon jedne entite z kazdeho datasetu. Pokud bude pouzity nejaky existujici search engine, pak musi k nemu existovat jednoduchy pristup z prostredi jazyka Java (nativni / Web services / ...).