Skelbimas

Ar tikite mintimi, kad kai kas nors bus paskelbta internete, jis bus paskelbtas visam laikui? Na, šiandien mes tą mitą išsklaidysime.

Tiesa ta, kad daugeliu atvejų informaciją iš interneto yra visiškai įmanoma ištrinti. Žinoma, yra įrašų apie tinklalapius, kurie buvo ištrinti ieškant „Wayback“ mašina, tiesa? Taip, absoliučiai. „Wayback“ kompiuteryje yra įrašai apie tinklalapius, grįstus daugelį metų - puslapius, kurių nerasite naudodami „Google“ paiešką, nes šis puslapis neegzistuoja. Kažkas jį ištrynė arba svetainė buvo uždaryta.

Taigi, nėra ko apeiti, tiesa? Informacija amžinai bus išgraviruota interneto akmenyje, kurią bus galima pamatyti kartoms? Na, ne visai tiksliai.

Tiesa ta, kad nors gali būti sunku ar neįmanoma sunaikinti svarbias naujienų istorijas, kurios iš vienos naujienų svetainės ar tinklaraščio išplito į kitą, pavyzdžiui, virusas, iš tikrųjų yra gana lengva visiškai ištrinti tinklalapį ar kelis tinklalapius iš visų egzistavimo įrašų - pašalinti tą puslapį tiek paieškos sistemoms, tiek

instagram viewer
„Wayback“ mašina Naujasis „Wayback“ aparatas leidžia jums vizualiai keliauti atgal per interneto laikąPanašu, kad nuo „Wayback Machine“ pasirodymo 2001 m., Svetainių savininkai nusprendė išmesti „Alexa“ pagrindu sukurtą foną ir perdaryti jį naudodami savo atvirojo kodo kodą. Atlikę bandymus su ... Skaityti daugiau . Žinoma, yra laimikis, bet mes pasieksime tai.

3 būdai pašalinti tinklaraščių puslapius iš interneto

Pirmasis metodas yra tas, kurį naudoja dauguma svetainių savininkų, nes jie nieko geriau nežino - tiesiog ištrina tinklalapius. Taip gali nutikti dėl to, kad supratote, jog savo svetainėje turite dubliuotą turinį, arba todėl, kad turite puslapį, kurio nenorite rodyti paieškos rezultatuose.

Tiesiog ištrinkite puslapį

Visiško tinklalapio ištrynimo problema yra ta, kad jūs jau sukūrėte puslapį tinkle, gali būti nuorodų iš jūsų svetainės, taip pat išorinių nuorodų iš kitų svetainių į tą svetainę puslapis. Ištrindami „Google“ iškart atpažįsta tą jūsų puslapį kaip trūkstamą puslapį.

failas nerastas

Taigi, ištrindami savo puslapį, jūs ne tik sukūrėte aptikimo klaidų „Nerasta“ problemą, bet ir sukūrėte problemą visiems, kurie kada nors susiejo puslapį. Paprastai vartotojai, kurie pateks į jūsų svetainę iš vienos iš tų išorinių nuorodų, matys jūsų 404 puslapį, kuris nėra pagrindinė problema, jei naudosite naudingus pasiūlymus naudodami „Google“ pritaikytą 404 kodą, pvz., 404 kodą alternatyvos. Bet, jūsų manymu, gali būti ir grakštesnių būdų, kaip ištrinti puslapius iš paieškos rezultatų, nepašalinant visų tų 404-ųjų esamų gaunamų nuorodų, tiesa?

Na, yra.

Pašalinkite puslapį iš „Google“ paieškos rezultatų

Visų pirma, turėtumėte suprasti, kad jei tinklalapis, kurį norite pašalinti iš „Google“ paieškos rezultatų, nėra jūsų svetainės puslapis, tada jums nesiseka, nebent yra teisinių priežasčių arba jei svetainė paskelbė jūsų asmeninę informaciją internete be jūsų leidimas. Tokiu atveju naudokite „Google“ šalinimo trikčių šalinimo priemonė pateikti prašymą pašalinti puslapį iš paieškos rezultatų. Jei turite pagrįstą atvejį, pašalinus puslapį galite sulaukti tam tikros sėkmės - žinoma, jums gali pasisekti dar didesnė sėkmė susisiekti su svetainės savininku Kaip pašalinti melagingą asmeninę informaciją internetePrivatumas internete nebeužtikrinamas. Sužinokite, kaip pranešti apie svetainę ir pašalinti asmeninę informaciją iš interneto. Skaityti daugiau kaip aprašiau, kaip tai padaryti dar 2009 m.

Jei puslapis, kurį norite pašalinti iš paieškos rezultatų, yra jūsų svetainėje, jums pasisekė. Viskas, ką jums reikia padaryti, tai sukurti robots.txt failą ir įsitikinkite, kad uždraudėte konkretų puslapį, kurio nenorite paieškos rezultatuose, arba visą katalogą su turiniu, kurio nenorite indeksuoti. Štai kaip atrodo blokuojamas vienas puslapis.

Vartotojo atstovas: * Neleisti: /my-deleted-article-that-i-want-removed.html

Taip galite užblokuoti robotus, kad jie nerastų visų jūsų katalogų.

Vartotojo atstovas: * Neleisti: / turinys apie asmeninius dalykus /

„Google“ turi puikų palaikymo puslapis tai gali padėti sukurti failą robots.txt, jei dar niekada jo nesukūrėte. Tai labai gerai veikia, kaip neseniai paaiškinau straipsnyje apie sindikavimo sandorių struktūrizavimas Kaip derėtis dėl sindikavimo pasiūlymų ir apsaugoti paieškos reitingąŠiomis dienomis siaučia sindikatas. Bet staiga galite pastebėti, kad sindikacijos partneris yra aukščiau nei jūs istorijos, kurią parašėte, paieškos rezultatuose! Apsaugokite savo paieškos reitingą. Skaityti daugiau kad jie nepakenktų jums (prašo sindikacijos partnerių neleisti indeksuoti jų puslapių ten, kur esate sindikuoti). Kai mano sindikacijos partneris sutiko tai padaryti, puslapiai, kurių turinys buvo dubliuotas mano tinklaraštyje, visiškai išnyko iš paieškos sąrašų.

google-aukcionai

Tik pagrindinė svetainė patenka į trečią vietą to puslapio, kuriame jie išvardija mūsų pavadinimą, bet mano tinklaraštis dabar pateiktas tiek pirmoje, tiek antroje vietose; kas būtų buvę beveik neįmanoma, jei aukštesnės valdžios svetainė paliktų dubliuotą puslapį indeksuotą.

Daugelis žmonių nesuvokia, kad tai įmanoma padaryti ir naudojantis interneto archyvu („Wayback Machine“). Štai eilutės, kurias turite pridėti prie savo robots.txt failo, kad tai įvyktų.

Vartotojo agentas: ia_archiver. Neleisti: / mėginio kategorija /

Šiame pavyzdyje sakau interneto archyvui iš „Wayback Machine“ pašalinti viską, kas yra mano svetainės pavyzdžių kategorijos pakatalogyje. Interneto archyvas paaiškina, kaip tai padaryti jų pašalinimo pagalbos puslapyje. Čia jie taip pat paaiškina, kad „Interneto archyvas nėra suinteresuotas siūlyti prieigą prie interneto svetainių ar kitų interneto dokumentų, kurių autoriai nenori, kad jų medžiaga būtų kolekcijoje“.

Tai prieštarauja visuotinai vyraujančiam įsitikinimui, kad viskas, kas skelbiama internete, visą amžinybę gali patekti į archyvą. Ne - turinį turintys žiniatinklio valdytojai gali specialiai pašalinti turinį iš archyvo naudodami robots.txt metodą.

Pašalinkite atskirą puslapį su meta žymėmis

Jei turite tik kelis atskirus puslapius, kuriuos norite pašalinti iš „Google“ paieškos rezultatų, jums iš tikrųjų nereikia naudoti robots.txt metodo išvis galite tiesiog pridėti teisingą „robotų“ metažymą į atskirus puslapius ir nurodyti robotams neindeksuoti ir nesekti nuorodų visame puslapis.

išoriniai-saitai3

Galite sustabdyti robotų indeksavimą puslapyje, naudodami aukščiau esančią „robotų“ meta, arba galite nurodyti „Google“ robotui neindeksuoti, kad puslapis būtų pašalintas tik iš „Google“ paieškos rezultatų, o kiti paieškos robotai vis tiek galėtų pasiekti puslapį turinys.

Visiškai priklauso nuo to, kaip norite valdyti, ką robotai daro su šiuo puslapiu, ir ar puslapis yra įtrauktas į sąrašą. Tai gali būti geresnis būdas tik keliems atskiriems puslapiams. Norėdami pašalinti visą turinio katalogą, naudokite metodą robots.txt.

Turinio „pašalinimo“ idėja

Dėl šios priežasties visa mintis „turinio ištrynimas iš interneto“ sukasi ant galvos. Techniškai, jei pašalinsite visas savo nuorodas į savo svetainės puslapį ir pašalinsite jas iš „Google“ paieškos ir Interneto archyvas naudojant robots.txt techniką, puslapis yra skirtas visiems tikslams ir tikslams „ištrinti“ iš interneto. Šaunus dalykas yra tai, kad jei yra esamų nuorodų į puslapį, šios nuorodos vis tiek veiks ir jūs nesukelsite 404 klaidų tiems lankytojams.

Tai švelnesnis požiūris į turinio pašalinimą iš interneto visiškai nesutrikdant esamo jūsų svetainės nuorodų populiarumo internete. Galų gale jūs, bet visada, kaip tvarkote, kokį turinį kaupia paieškos varikliai ir interneto archyvas atminkite, kad nepaisant to, ką žmonės sako apie internetinėje erdvėje skelbiamų dalykų gyvavimo trukmę, jis tikrai yra jūsų viduje kontrolė.

Ryanas turi elektros inžinerijos bakalauro laipsnį. Jis 13 metų dirbo automatikos inžinerijoje, 5 metus IT srityje, o dabar yra programų inžinierius. Buvęs „MakeUseOf“ generalinis redaktorius, jis kalbėjo nacionalinėse duomenų vizualizacijos konferencijose ir buvo rodomas per nacionalinę televiziją ir radiją.