בירור | שמירת סיפור מהאינטרנט לקובץ pdf

נחמן פלח

משה-שמחה סליחה מתנצל יש בעיה באפליקציה היא לא מצליחה לשמור את הקובץ אמרת שזה תצוגה מוגנת אז זה לא נותן.
ניסית לעשות כונטרול p במחשב?

משה שמחה

@נחמן-פלח זה מדפיס רק עמוד אחד.

נחמן פלח

@משה-שמחה בדקת בהגדרות לפני שאתה מדפיס אם יש לשנות.
לא עזר בכמה עמודים מדובר 10 לא עבודה קשה כ"כ

משה שמחה

@נחמן-פלח בדקתי, 122 עמ'.

נחמן פלח

@משה-שמחה בודק אפשריות

נחמן פלח

@נחמן-פלח מצטער אבל היוצר חכם מדי בשביל שיהיה אפשר להוריד את זה
הבעיה בצורה של התצוגה
נ.ב אשמח לשמוע שהסתדרת

נחמן פלח

@משה-שמחה אני יכול לנסות לעשות הסרטת מסך ולהוציא תמונה תמונה.
יעזור לך?

נחמן פלח

@משה-שמחה
ההסרטה מוכנה להביא לך? או שאתה רוצה לחכות עד שאני יוציא את התמונות?

הייתי שמח להבין

@משה-שמחה כתב בבירור | שמירת סיפור מהאינטרנט לקובץ pdf:

@הייתי-שמח-להבין
תודה רבה על הטרחה והמאמץ אם תוכל לערוך את הכל לקובץ pdf ולהעלות בצורה שלא יחסם בנטפרי זה מאוד יעזור.

https://drive.google.com/******file/d/1Feg5cgVR-NISKegPONmc7LU1H1icWSBQ/view?usp=sharing
זה קישור לקובץ PDF של 20 העמודים הראשונים בדרייב, ניתן להורדה, להסיר כוכביות מהקישור, אם עדיין יש צורך לערוך עוד תכתוב לי.

נחמן פלח

@הייתי-שמח-להבין איך עשית?

הייתי שמח להבין

@נחמן-פלח הדפסתי ל-PDF עמוד עמוד, ומיזגתי את הכל לקובץ אחד.

נחמן פלח

@הייתי-שמח-להבין אתה צריך לשמוח.
למה?! כי השם משתמש זה הייתי שמח להבין והבנת!! ואם הבנת גם את זה אז תשמח עוד יותר

הייתי שמח להבין

@הייתי-שמח-להבין כתב בבירור | שמירת סיפור מהאינטרנט לקובץ pdf:

@משה-שמחה כתב בבירור | שמירת סיפור מהאינטרנט לקובץ pdf:

@הייתי-שמח-להבין
תודה רבה על הטרחה והמאמץ אם תוכל לערוך את הכל לקובץ pdf ולהעלות בצורה שלא יחסם בנטפרי זה מאוד יעזור.

ערכתי בינתיים 2 קבצי PDF המכילים כל אחד 20 עמודים, העליתי אותם לדרייב, והם ניתנים להורדה.
קובץ 1- https://drive.google.com/******file/d/1Feg5cgVR-NISKegPONmc7LU1H1icWSBQ/view?usp=sharing
קובץ 2- https://drive.google.com/file/d/******1sXbURp416YW62Bc_3XEmMbw-7feSRh6m/view?usp=sharing
להסיר כוכביות מהקישורים, אם עדיין יש צורך לערוך עוד תכתוב לי.

sivan22

@הייתי-שמח-להבין הנה קוד שיעשה במקומך את כל העבודה:

from base64 import b64decode
import os
import time
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.common.print_page_options import PrintOptions, Orientation

# some tweaks to bypass bot detection
options = webdriver.ChromeOptions()
options.add_experimental_option("excludeSwitches", ["enable-automation"])
options.add_experimental_option('useAutomationExtension', False)
options.add_argument("--disable-blink-features=AutomationControlled")
options.page_load_strategy = 'normal'
options.headless = True



# initialise webdriver
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()),options=options)
#driver = webdriver.Chr


for i in range(1,123):
    driver.get("https://online.fliphtml5.com/nejge/kkyl/#p="+str(i))
    time.sleep(1)
  
#save the page to disk
    printOptions = PrintOptions()
    printOptions.orientation="landscape"
    open(str(i)+".pdf", "wb").write(b64decode(driver.print_page(printOptions)))


# after scraping all pages, merge them with pypdf
from pypdf import PdfMerger

files = os.listdir()
pdfs = [s for s in files if '.pdf' in s]
#sorting the file names by number - not alphabethic
def forSorting(s)->int:
    s=s.split('.')[0]
    return int(s)
pdfs.sort(key=forSorting)

merger = PdfMerger()

for pdf in pdfs:
    merger.append(pdf)

merger.write("result.pdf")
merger.close()

והוא אכן עשה את העבודה, הנה התוצאה:
result.pdf
שים לב, @משה-שמחה
אז נעים להכיר את סלניום, מלך הבוטים...

sivan22

@משה-שמחה כתב בבירור | שמירת סיפור מהאינטרנט לקובץ pdf:

יש כאן סיפור בהמשכים יש דרך לשמור את כל הסיפור כקובץ pdf לקריאה אופליין?

התשובה בפוסט הקודם.

משה שמחה

@הייתי-שמח-להבין כתב בבירור | שמירת סיפור מהאינטרנט לקובץ pdf:

ערכתי בינתיים 2 קבצי PDF המכילים כל אחד 20 עמודים, העליתי אותם לדרייב, והם ניתנים להורדה.

תודה רבה, עכשיו אני יהיה באמצע המתח.

@sivan22 כתב בבירור | שמירת סיפור מהאינטרנט לקובץ pdf:

והוא אכן עשה את העבודה, הנה התוצאה:
result.pdf

בינתיים חסום בנטפרי, שלחתי בקשה לבדיקה.

נחמן פלח

@sivan22 איך משתמשים בזה זה נראה מסבך מה עושים עם זה

sivan22

@נחמן-פלח זה משתמש בכרום שלך, כדי לגלוש באינטרנט ולעשות כל דבר שיעלה בדעתך באמצעות קוד בפייתון (או בשפות אחרות).
תיעוד https://www.selenium.dev/documentation/webdriver/

נחמן פלח

@sivan22 סינית בשבילי תכלס אני רוצה להשתמש בזה איך אפשר

הייתי שמח להבין

@sivan22 כתב בבירור | שמירת סיפור מהאינטרנט לקובץ pdf:

@הייתי-שמח-להבין הנה קוד שיעשה במקומך את כל העבודה:

from base64 import b64decode
import os
import time
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.common.print_page_options import PrintOptions, Orientation

# some tweaks to bypass bot detection
options = webdriver.ChromeOptions()
options.add_experimental_option("excludeSwitches", ["enable-automation"])
options.add_experimental_option('useAutomationExtension', False)
options.add_argument("--disable-blink-features=AutomationControlled")
options.page_load_strategy = 'normal'
options.headless = True



# initialise webdriver
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()),options=options)
#driver = webdriver.Chr


for i in range(1,123):
    driver.get("https://online.fliphtml5.com/nejge/kkyl/#p="+str(i))
    time.sleep(1)
  
#save the page to disk
    printOptions = PrintOptions()
    printOptions.orientation="landscape"
    open(str(i)+".pdf", "wb").write(b64decode(driver.print_page(printOptions)))


# after scraping all pages, merge them with pypdf
from pypdf import PdfMerger

files = os.listdir()
pdfs = [s for s in files if '.pdf' in s]
#sorting the file names by number - not alphabethic
def forSorting(s)->int:
    s=s.split('.')[0]
    return int(s)
pdfs.sort(key=forSorting)

merger = PdfMerger()

for pdf in pdfs:
    merger.append(pdf)

merger.write("result.pdf")
merger.close()

והוא אכן עשה את העבודה, הנה התוצאה:
result.pdf
שים לב, @משה-שמחה
אז נעים להכיר את סלניום, מלך הבוטים...

אתה פשוט גאון, חבל שבאת רק עכשיו.
צריך בשביל להריץ את זה ספריית פייתון או משהו אחר?