Avatar billede kurtba Ekspert
08. januar 2022 - 12:02 Der er 13 kommentarer og
1 løsning

Se samlet størrelse på en hjemmeside

En hjemmeside jeg bruger en del er formentlig ved at lukke. Derfor vil jeg gerne downloade den komplet, men jeg tror at den fylder endog rigtigt meget. Kan man på en eller anden måde se, hvor meget den ca. fylder.
Jeg er begyndt at downloade den med WinHTTrack, og den har hentet ca. 1.5 gb på 19 timer, så jeg frygter, at jeg aldrig når at blive færdig. Derfor viile jeg gerne se, hvor meget den fylder.
Evt foslag til et program som er hurtigere til at downloade (har 1000 mbit).
Avatar billede a3-seo.dk Ekspert
08. januar 2022 - 12:53 #1
Hvis det er en wordpress side - så er Duplicator, en sikker vej til backup, kopiering eller cloning af dine WordPress sider https://a3-seo.dk/backup-kopiering-cloning-wordpress/
Avatar billede milter Ekspert
08. januar 2022 - 12:57 #2
En anden mulighed kunne være at gemme hele websiden og dens undersider hos et af de webarkiver, der nævnes i linket herunder.

https://www.guru99.com/best-internet-archive-wayback-machine-alternatives.html
Avatar billede a3-seo.dk Ekspert
08. januar 2022 - 13:05 #3
Tak Milter
Wayback bruger jeg ofte, kendte ikke de andre.
Wayback har virket til mine behov, men disse vil jeg absolut kigge på ;-)
Avatar billede kurtba Ekspert
08. januar 2022 - 15:12 #4
#1 Det er ikke min egen webside, så om det er wordpress  eller ej aner jeg ikke, og kan vist heller ikke bruge det, når det ikke er min egen side og heller ikke har wordpress installeret.
#2 Jeg prøvede lige archive.fo, men den tager kun en side ad gangen, og da hjemmesiden har over 10.000 undersider, giver det ikke megen mening. De øvrige links/programmer kan jeg heller ikke lige se, at de skulle kunne hjælpe. Jeg har prøvet lidt med Wayback, men kan ikke gennemskue, hvordan jeg skal bruge den, men kan se at der åbenbart er taget en del kopier af den aktuelle hjemmeside, men jeg kan ikke komme ind og bruge de kopier, som der angiveligt liger af den.
Hjemmesiden det drejer sig om er www.stampmasteralbum.com, og det er især nogle underliggende søgesider, jeg har brug for, og derfor skal hele søgefunktionen være intakt og brugbar efter download.
Uanset hvad virker Wayback meget langsom (hvilket også står i beskrivelsen), så alene derfor virker den ikke brugbar, da det er vitalt, at søgninger kan gå lynhurtigt.
Avatar billede milter Ekspert
08. januar 2022 - 15:57 #5
Hvis du laver en konto hos Waybackmachine, får du mulighed for at gemme en webside med alle underliggende links. Jeg har selv en konto. Eksempel på det kan du se herunder: Muligheden for at gemme med "Save Outlinks" skulle gemme alle underliggende links, hvor det er muligt:

https://blog.archive.org/2019/10/23/the-wayback-machines-save-page-now-is-new-and-improved/

Det tager somme tider lidt tid, før en gemt side vises korrekt. Du kan også somme tider få en lidt misvisende reaktion ved gemning af en side. Herunder er det gemte  link til  www.stampmasteralbum.com:

https://web.archive.org/web/20211225113056/http://stampmasteralbum.com/
Avatar billede a3-seo.dk Ekspert
08. januar 2022 - 16:02 #6
Siden er til salg, grundet "Retirement". Køb den dog og få den rettet til nutiden. den er "old nordisk".
Side mæssigt indeholder den 2441 sider!
Avatar billede milter Ekspert
08. januar 2022 - 16:16 #7
Velbekom a3-seo.dk :-)
Avatar billede kurtba Ekspert
08. januar 2022 - 22:03 #8
Det ser ud til. at jeg har fået en brugbar kopi af hjemmesiden, selv om loggen viser en del fejl. Det tog godt 1½ dag og der er knap 80.000 filer i 343 mapper, og det fylder ca. 3 gb.
Det blev så den kopi jeg havde sat i gang med WinHTTtrack copier.
På en anden pc er jeg i gang med at hente med Cyotek Webcopy. Den har nu været i gang i 10 t og har hentet 800 mb, så det er åbenbart noget som tager tid.
Da Milter var tættest på en mulig løsning, markerer jeg ham med løsningen, selv om jeg endte med min egen og faktisk slet ikke fik svar på det oprindelige spørgsmål :-)
Avatar billede milter Ekspert
16. januar 2022 - 19:03 #9
@ kurtba og  a3-seo.dk.

Jeg er lidt nysgerrig mht. dine erfaringer med  www.stampmasteralbum.com . Jeg har selv gennem flere år brugt Waybackmachine, både for at gemme websider til eget og andres brug og for at finde websider, andre har tilføjet.

Jeg forsøgte selv at gemme websiden med alle underliggende links 8-1-2022. Der findes også et link til gemning 25-1-2021 på Waybackmachine, som også ser ud til at have forsøgt at gemme hele sidens historie.

Så mit spøgsmål er: Kan du få adgang alle de sider, du ønsker/ønskede, via Waybackmachine?

Og måske  a3-seo.dk har nogle erfaringer på det punkt? Jeg er godt klar over, at nogle websider forsøger at forhindre webcrawling, men udover det...?
Avatar billede kurtba Ekspert
16. januar 2022 - 21:12 #10
Jeg fik  ikke brugt waybackmachine.
Jeg er endt med den kopi jeg fik ned med WinHTTrack copier, samt med en kopi jeg fik ned med Cyotek Webcopy.
I begge tilfælde tog det ca. 1½ døgn at hente den, og i begge tilfælde viste programmet, at der var en del sider, som den ikke fik med ned på grund af diverse fejl, men når jeg  har prøvet programmet (hvilket jeg kun har gjort i meget begrænset omfang), så er jeg endnu ikke stødt på nogen fejl.
En stor del af hjemmesiden har jeg slet ikke brug for, idet det kun er inde  på søgedelen med at finde frem til, hvor et frimærke stammer fra, at jeg ind i mellem har brug for.
Meget af det handler om køb og salg, og den del bruger jeg slet ikke, og et meget hurtigt kig på de mange fejlende sider, så umiddelbart ud til at være fra salgssiderne.
Avatar billede a3-seo.dk Ekspert
17. januar 2022 - 04:32 #11
#9 Milter
Waybackmachine er et udmærket værktøj, men virker kun på sider der enten er tilmeldt fysisk, eller Waybackmachine har set dem via link fra andre sider der er blevet indekseret i Waybackmachine.

Mange gange kan man komme udfor, at kun forsiden og 2-3 andre sider findes i Waybackmachine. Eller slet ikke er tilstede i Waybackmachine.

Hvilket egentligt er meget naturligt - Data tager plads ;-)
Avatar billede milter Ekspert
19. januar 2022 - 19:49 #12
@ kurtba og  a3-seo.dk.

Tak for kommentarerne.

Min nysgerrighed gik på, om der findes nogen måde, man kan finde ud af, om alle sider med underliggende links virkeligt er blevet gemt på Waybackmachine. Jeg har gennem et stykke tid testet, om alle links på www.stampmasteralbum.com er blevet gemt. Jeg har gjort det samme med andre websider, men jeg har endnu kke fundet nogen metode til at bekræfte, at alle sider og medfølgende links vitterligt er blevet gemt.

Mine test indtil nu indikerer, at alt er blevet gemt, også af den side, du tilsyneladende er mest interesseret i, kurtba, nemlig

https://web.archive.org/web/20220108151313/https://www.stampmasteralbum.com/ForeignCountryIdentifierHome.htm
Avatar billede kurtba Ekspert
20. januar 2022 - 22:21 #13
Testede lige lidt, og det ser ud til, som du anfører, at alle undersider også ligger på waybackmachine.
Avatar billede milter Ekspert
21. januar 2022 - 10:44 #14
Tak :-)
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester



IT-JOB

Knud E. Hansen A/S

IT-supporter

Udviklings- og Forenklingsstyrelsen

IAM-medarbejder

Udviklings- og Forenklingsstyrelsen

Udviklere til Internationalt samarbejde

Cognizant Technology Solutions Denmark ApS

Senior Consultant - Finance, Insurance, Pension