diafora 2
blog 35
arduino 4
electronics 3
technology 24
programming 48
software 2

Αρθρογραφία

Με κατηγορία

diafora 2
blog 35
arduino 4
electronics 3
technology 24
programming 48
software 2

programming

Έξυπνες αναζητήσεις

Το googling είναι μια από τις πιο σημαντικές δεξιότητες για κάθε προγραμματιστή. Ας δούμε πώς κάνουμε εξειδικευμ�...

Ημ/νία 2022-08-23 Συντάκτης: nc

programming

JavaScript Timestamp

Στη JavaScript, οι χρονικές σημάνσεις συνήθως συσχετίζονται με την ώρα Unix. Και υπάρχουν διαφορετικές μέθοδοι για τ...

Ημ/νία 2022-08-22 Συντάκτης: nc

programming

HTTP vs HTTPS – Ποια είναι η διαφορά;

Αλληλεπιδρούμε πολύ με το HTTP και το HTTPS στην καθημερινή μας ζωή, αλλά πολλοί από εμάς δεν γνωρί�...

Ημ/νία 2022-07-15 Συντάκτης: nc

programming

PHP: Absolute & Relative Paths

An absolute path refers to defining the full exact file path, for example, D:\http\project\lib\file.php. While a relative path is based on the current working directory, where the script is located. ...

Ημ/νία 2022-06-23 Συντάκτης: nc

programming

PHP: Interface

What Is a PHP Interface? A PHP interface defines a contract which a class must fulfill. If a PHP class is a blueprint for objects, an interface is a blueprint for classes. Any class implementing a ...

Ημ/νία 2022-06-22 Συντάκτης: nc

programming

Python: Συλλογή links από μια ιστοσελίδα

Δημοσίευση: 2022-04-28 • Share Article:

@Ο πιο κάτω κώδικας μας δίνει τη δυνατότητα να αποθηκεύσουμε όλα τα links που έχει μια ιστοσελίδα. Χρησιμοποιεί τη βιβλιοθήκη bs4 (BeautifulSoup). Αν δεν την έχετε εγκατεστημένη:
pip install bs4
Αφού κάνει parsing τον κώδικα, αποθηκεύει τα links σε αρχείο κειμένου (myLinks.txt), αντί να τα εμφανίζει στην οθόνη. Μπορείτε να αλλάξετε την παράμετρο 'a' σε 'w', ώστε το αρχείο να δημιουργείται κάθε φορά με τα links της νέας ιστοσελίδας. Εξ' ορισμού η παράμετρος είναι 'a', δηλαδή κάθε φορά που τρέχουμε το script, τα δεδομένα προστίθενται στο αρχείο κειμένου.


import requests as rq
from bs4 import BeautifulSoup

url = input("Enter Link: ")
if ("https" or "http") in url:
    data = rq.get(url)
else:
    data = rq.get("https://" + url)
soup = BeautifulSoup(data.text, "html.parser")
links = []
for link in soup.find_all("a"):
    links.append(link.get("href"))

with open("myLinks.txt", 'a') as saved:
    print(links[:10], file=saved)

Foreach programming

Εγγραφείτε για να βλέπετε τα εξειδικευμένα άρθρα.