Saljic crawler changed substring call. #95
Reference in New Issue
Block a user
Delete Branch "saljic-crawler-fix"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Changed places where substring is called on undefined - possibly. Need to check on staging crawler.
@RabbIT09-n Kontam zasto uopste parsiramo agency id kada znamo da je u pitanju samo jedna agencija?
Imas li primjer kako izgleda taj URL obicno i kako je moguce da bude
null?Mozes li malo pojasniti kako ovo parsiranje radi? Da li je bolje koristiti regex u ovom slucaju?
Parsiramo agencyObjectId a to je broj tj id pod kojim se nekretnina vodi u agenciji. Jeste uvijek Saljic agencija ali npr je kod njih https://www.saljicnekretnine.ba/v2/nekretnina/746 ovo je nekretnina 746 i to parse. Eh nisam ja sigurna da je ovaj substring bacao onu gresku sto je Senad nasao jer ima jos substring poziva nize. Kad god sam gledala log nije mi se pojavljivala greska. Pa sam sad u ovom commit-u dodala da loguje kad god scrape radi neke nekretnine da kad deployamo na staging jos malo vidim sta nije ok tj da li je to url ili neceg drugog. Mozda i jos logova treba dodati...
Ovo bi trebalo da nadje lon i lat iz linka sa google mapa, taj link bude npr. `
Jedino gdje sam nasla da procitam lat i long su kod ovog marker dijela linka is src atributa. Eh sad provjerim da li moze nekako elegantnije da se ovo izdvoji :)
Ne znam gdje mi je nestoa dio poruke:
src="https://www.openstreetmap.org/export/embed.html?bbox=18.19220066070557%2C43.8330408429302%2C18.236403465271%2C43.85882283079319&layer=mapnik&marker=43.845948705143044%2C18.21430206298828"
changed this line in version 2 of the diff
added 1 commit
f56cd5b5- More elegant scrape of lat and long.Compare with previous version
Promijenila sam kod tako da malo elegantnije scrape-a lat i long za nekretninu sa mape. I mislim da na tome pada ovo gore substring a ne na url-u. Pada im mapa ova neka koju koriste npr meni trenutno ne radi i onda je ne moze scrape
merged
mentioned in commit
44402a9cc4