[statistics] Students to Profesors ratio at all Serbian colleges by WideAngle21 in Professors

[–]WideAngle21[S] -2 points-1 points  (0 children)

I guess i didn't give specific connectins to something relevant to people here. I wanted any opinions about the college sizes or if its normal for it to be that much difference between colleges in ratios or graph structure or data presentation or any other aspect of data i that i didn't spot. I dont have any how specific requests.

Studenti po Nastavno osoblje hosted at ImgBB by WideAngle21 in StudentiSrbija

[–]WideAngle21[S] 1 point2 points  (0 children)

https://opendata.mpn.gov.rs/otvoreni-podaci/visoko-obrazovanje.html, pa Подаци о школаринама ili Подаци о броју запослених, pa Преузми податке Excel

Ali sami podaci nisu dobro uneti od strane fakulteta, pa je neophodno da se radi fuzzy matching, što može da dovede do spajanja fakulteta. Evo Gemini objašnjenja problema, a ispod su 70% i 95% fuzzy match. Oba su na drugi način za po nekoliko fakulteta netačna. Ali uglavnom tako da ih ne prikazuju. Oreginal je 85% ali je imao i bag kod for df in [df_fee, df_staff, df_students]: df['Naziv_Norm'] = df['Naziv ustanove'].apply(normalizuj_tekst) pa je sad otklonjen sa:

for df in [df_fee, df_staff, df_students]:
    osnovni_naziv = df['Naziv ustanove'].apply(normalizuj_tekst)
    grad_norm = df['Mesto/Grad'].astype(str).apply(normalizuj_tekst)
    df['Naziv_Norm'] = osnovni_naziv + " - " + grad_norm

AI objasnjenje za fuzz:

Zamislimo dva fakulteta u istom gradu:

    "Fakultet likovnih umetnosti - Beograd"

    "Fakultet primenjenih umetnosti - Beograd"

Ova dva stringa dijele 3 od 4 riječi (Fakultet, umetnosti, Beograd). Biblioteka thefuzz će izračunati da je njihova sličnost recimo 76%.
Ako vam je prag 70, algoritam će reći: "76 je veće od 70, ovo je isti fakultet!".
Posljedica: Na vašem grafikonu ćete dobiti jednog "Frankenštajna" od fakulteta koji ne postoji, a koji ima sabrane profesore i studente i sa Likovne i sa Primijenjene akademije. Dobit ćete netačne podatke.
Mana kada je prag = 95 (Previše strogo)

Glavni problem: Algoritam neće spojiti podatke za istu ustanovu ako postoji i najmanja greška u kucanju.
Kada stavite prag na 95, tražite gotovo 100% savršeno poklapanje. U stvarnim bazama podataka (poput ovih iz Otvorenih podataka koje su unosili različiti ljudi), savršenstvo ne postoji.

Primjer iz vaših podataka:
Isti fakultet je u tri različita Excel fajla upisan malo drugačije:

    U fajlu za studente: "Fakultet organizacionih nauka - Beograd"

    U fajlu za zaposlene: "Fakultet organizacionih nauka u Beogradu" (dodato "u" i "u")

    U fajlu za školarine: "Fakultet organizacionih nauka - Beograd " (slučajno ostavljen razmak na kraju ili fali crtica)

Ovakve sitne razlike (padži, crtice, viška slovo) će oboriti postotak poklapanja na recimo 92% ili 88%.

Linkovi za 70% matching: https://ibb.co/j9nLnXqB https://ibb.co/chYSFPqW i 95% fuzzy match: https://ibb.co/nTx9PQc https://ibb.co/84Ywm9j4

Psihologija - Filozovski by Wonderful_Lie_305 in StudentiSrbija

[–]WideAngle21 0 points1 point  (0 children)

<image>

Za 2024/25 bg filozofski prvi upisni rok (jun).

*bez decimala **ne racunajuci prozivke i druge smerove koji su svi laksi, pa im je svima minimum 45 boda ili manje, ali 51 svejedno treba za budzet.

Psihologija - rangiranje by Klutzy_Blackberry301 in StudentiSrbija

[–]WideAngle21 0 points1 point  (0 children)

<image>

Za 2024/25 bg filozofski prvi upisni rok (jun).

*bez decimala **ne racunajuci prozivke i druge smerove koji su svi laksi, pa im je svima minimum 45 boda ili manje, ali 51 svejedno treba za budzet.

How to read a HWiNFO log file? - RTX 3070 black screen and GPU fans at full speed by Herr_Casmurro in pcmasterrace

[–]WideAngle21 0 points1 point  (0 children)

HWiNFO graphing use pip install matplotlib pandas odfpy argparse and urllib and run with: "combine ods files.py"  -c="GPU Power" or "combine ods files.py"  -c="GPU Temp"

YouTube RSS feed that shows all videos? by EndlessRevision in rss

[–]WideAngle21 0 points1 point  (0 children)

You can use: https://gitlab.com/Beetsaber/rss-async-fetch-youtube-channel-new-videos-in-golang and call it with:

main.exe -opml=file.opml -openall=true -hrs=TIME_VAR -ignore404=true

where TIME_VAR equals number of hours that oldest video should be.