Czy jest jakieś narzędzie (nie mówię o wbudowanej na danej stronie wyszukiwarce), które pozwala wyszukiwać zadane słowa w tekstach artykułów zawartych na stronie? Nie chodzi mi o szukanie słów kluczowych czy hashtagów, czy czegoś takiego, tylko słów w samym tekście.
#informatyka #internet #pytanie #programowanie
m-q

Jeśli te teksty indeksuje google, to najlepiej jego użyć. Można określić w zapytaniu, że interesują Cię tylko wyniki z danej strony

site:adres.com

entropy_

@rain ctrl+f?

Otwierasz stronę, wciśnij ctrl i "f" jednocześnie, napisz ciąg znaków którego szukasz i enter

rain

@entropy_ potrzebuję tego do celów naukowych, otwieranie każdego artykułu na stronie i szukanie przez ctrl +f to trochę dużo pracy

entropy_

@rain jedno lubkilka lub wszystkie na raz:

Wyrażenie w cudzysłowie musi znaleźć się w tekście na przykład

"Steve Jobs" site:onet.pl

Wyszuka konkretnie "steve jobs" na onecie, nie znajdzie tekstu np jobs, steve

Jobs -steve site:onet.pl

Wyszuka jobs na onecie ale nie steve jobs. Minus to słowo którego nie chcesz w wyszukiwaniu.

Jobs apple -steve

Powinno wyszukiwać oferty pracy w apple ale nie steva jobsa itd

entropy_

@rain also po polsku jak szukasz

Wyróżnieni nauczyciele

To będzie też proponował wszystkie odmiany: wyróżniony nauczyciel, wyróżnione nauczycielki itp.

"wyróżnieni nauczyciele" w cudzysłowie będzie tej konkretniej frazy szukało bez odmiany i wyrazów bliskoznacznych.

Używaj też innych wyszukiwarek, bing, duckduckgo itp

KLH2

Albo nie rozumiem, albo... Chodzi Ci o ograniczenie wyszukiwania do treści zawartej na określonej stronie? Nie. O to nie może Ci chodzić. Możesz podać jakiś taki w miarę konkretny przykład - co chcesz znaleźć i gdzie. Nie musi to być autentyczny przykład - rozumiem, że nauka może być tajemnicza Analogiczny do prawdziwego.

rain

@KLH2 konkretny przykład - np serwis o filmach, z recenzjami, zapowiedziami itd. A ja chcę wyszukać wszystkie artykuły, gdzie pojawia się np słowo "montaż". Ale w treści, a nie tylko w słowach kluczowych przy artykule.

entropy_

@rain spróbuj zmodyfikować ten przykład

amazing "montage" -80s site:imdb.com

rain

@entropy_ dziękuję Teraz przydałoby się jeszcze jakieś narzędzie, które potrafiłoby "zaciągnąć" wyniki z netu na komputer.

entropy_

@rain jak ma to wyglądać? Nie rozumiem co chcesz zrobić

rain

@entropy_ znaleźć na danej stronie wszystkie artykuły, w których pojawia się dane słowo, następnie zaś jakoś je "zaciągnąć" na komputer i wykorzystać do analizy jakościowej. Dziś zainstalowałam sobie program MAXQDA, który do tejże analizy służy, ale nie wiem czy ma on opcję automatycznego pobierania sobie z netu takich danych. Byłaby to spora pomoc, bo nie musiałabym wklejać wszystkich artykułów po kolei.

entropy_

@rain do jakiejś setki zrobiłbym ręcznie. Parę godzin i po problemie.

Nad automatyzacją będziesz siedziała tydzień i też będziesz miała 100 artykułów tylko tydzień ustawiania i 30 sekund ściągania później.

Ogólnie nie ma prostego sposobu na to co chcesz zrobić.

rain

@entropy_ eh, zawsze trzeba iść tą trudniejszą drogą.

lactozzi

@rain chodzi Ci o scrapowanie stron?

rain

@lactozzi w zasadzie tak

lactozzi

@rain to nie są tanie rzeczy ( ͡~ ͜ʖ ͡°)

lactozzi

@rain to zależy czy chcesz użyć już gotowych rozwiązań to płaci się tam chyba od ilości przerobionych stron. Można też zlecić budowanie komuś. :) Wyszukaj "web scraping tools"

Zaloguj się aby komentować