Kā neļaut OpenAI rāpuļprogrammām nokasīt jūsu vietni

Kā neļaut OpenAI rāpuļprogrammām nokasīt jūsu vietni
Tādi lasītāji kā jūs palīdz atbalstīt MUO. Veicot pirkumu, izmantojot saites mūsu vietnē, mēs varam nopelnīt filiāles komisiju. Lasīt vairāk.

Lai gan lietotājiem patīk ChatGPT, jo tajā pašlaik ir milzīgs informācijas apjoms, to nevar teikt par vietņu īpašniekiem.





kā izslēgt lukturīti
MUO dienas video RITINĀT, LAI TURPINĀTU AR SATURU

OpenAI ChatGPT izmanto rāpuļprogrammas, lai notīrītu vietnes, taču, ja esat vietnes īpašnieks un nevēlaties, lai OpenAI rāpuļprogramma piekļūtu jūsu vietnei, šeit ir dažas lietas, ko varat darīt, lai to novērstu.





Kā darbojas OpenAI rāpuļprogramma?

A tīmekļa rāpuļprogramma (pazīstams arī kā zirneklis vai meklētājprogrammas robots) ir automatizēta programma, kas skenē informāciju internetā. Pēc tam tā apkopo šo informāciju tā, lai jūsu meklētājprogramma tai varētu viegli piekļūt.





Tīmekļa rāpuļprogrammas indeksē katru katra atbilstošā URL lapu, parasti koncentrējoties uz vietnēm, kas atbilst jūsu meklēšanas vaicājumiem. Piemēram, pieņemsim, ka meklējat noteiktu Windows kļūdu. Tīmekļa rāpuļprogramma jūsu meklētājprogrammā skenēs visus vietrāžus URL no vietnēm, kuras tā uzskata par autoritatīvākām saistībā ar Windows kļūdu tēmu.

OpenAI tīmekļa rāpuļprogrammu sauc par GPTBot, un saskaņā ar OpenAI dokumentācija , nodrošinot GPTBot piekļuvi jūsu vietnei, var palīdzēt apmācīt AI modeli, lai tas kļūtu drošāks un precīzāks, un tas var pat palīdzēt paplašināt AI modeļa iespējas.



Kā neļaut OpenAI pārmeklēt jūsu vietni

Tāpat kā lielākajai daļai citu tīmekļa rāpuļprogrammu, GPTBot var bloķēt piekļuvi jūsu vietnei, mainot vietnes robots.txt protokols (pazīstams arī kā robotu izslēgšanas protokols). Šis .txt fails tiek mitināts vietnes serverī, un tas kontrolē tīmekļa rāpuļprogrammu un citu automatizētu programmu darbību jūsu vietnē.

Šeit ir īss saraksts ar to, kas robots.txt fails var darīt:





  • Tas var pilnībā bloķēt GPTBot piekļuvi vietnei.
  • Tas var bloķēt, lai GPTBot nevarētu piekļūt tikai noteiktām URL lapām.
  • Tas var pateikt GPTBot, kurām saitēm tas var sekot un kurām nevar.

Tālāk ir norādīts, kā kontrolēt, ko GPTBot var darīt jūsu vietnē.

bezmaksas fm radio manā tālrunī

Pilnībā bloķējiet GPTBot piekļuvi jūsu vietnei

  1. Iestatiet failu robot.txt un pēc tam rediģējiet to ar jebkuru teksta rediģēšanas rīku.
  2. Pievienojiet GPTBot savai vietnei robots.txt sekojoši:
 User-agent: GPTBot 
Disallow: /

Bloķēt tikai noteiktām lapām, lai tās nevarētu piekļūt GPTBot

  1. Iestatiet robots.txt failu un pēc tam rediģējiet to ar vēlamo teksta rediģēšanas rīku.
  2. Pievienojiet GPTBot savai vietnei robots.txt sekojoši:
 User-agent: GPTBot 
Allow: /directory-1/
Disallow: /directory-2/

Tomēr paturiet prātā, ka, mainot robots.txt fails nav retroaktīvs risinājums, un visa informācija, ko GPTBot, iespējams, jau ir apkopojusi no jūsu vietnes, nebūs atkopjama.





OpenAI ļauj vietņu īpašniekiem atteikties no rāpuļprogrammas izmantošanas

Kopš rāpuļprogrammas tiek izmantotas AI modeļu apmācīšanai, vietņu īpašnieki ir meklējuši veidus, kā saglabāt savus datus privātus.

Daži baidās, ka AI modeļi pamatā zog viņu darbu, pat mazāku vietņu apmeklējumu skaitu attiecinot uz to, ka tagad lietotāji iegūst informāciju, nekad neapmeklējot viņu vietnes.

kā mainīt datus programmā Excel

Kopumā tas, vai vēlaties pilnībā bloķēt AI tērzēšanas robotus no jūsu vietņu skenēšanas, ir jūsu izvēle.