إعـــــــلان

تقليص
لا يوجد إعلان حتى الآن.

تحويل ملفات pdf إلى ملفات نصية قابلة للتعديل

تقليص
X
 
  • تصفية - فلترة
  • الوقت
  • عرض
إلغاء تحديد الكل
مشاركات جديدة

  • [شرح] تحويل ملفات pdf إلى ملفات نصية قابلة للتعديل

    كتب - خالد المسيهيج:
    من الأدوات المهمة التي يكثر السؤال عنها سواء في لينكس أو الأنظمة الأخرى تلك التي تقوم بتحويل ملفات pdf القياسية إلى ملفات نصية قابلة للتعديل، ولا ننكر أن هناك مجموعة برامج من هذا النوع، لكن الداعمة للعربية لا يكاد يكون لها وجود .. وفي أثناء إبحاري وبحثي في هذه الشبكة عثرت - وبالصدفة - على هذا البرنامج الرائع جداً الذي يتمناه كل مستخدم، والجميل فيه أنه يدعم اللغة العربية بشكل ممتاز وبدقة تصل إلى ما يزيد على 95%، ومن خلال تجربتي البسيطة للبرنامج وجدت أنه لا توجد أخطاء سوى مع حرف (لا) حيث يقوم بحذف الألف لتكون (ل) ومع لفظ الجلالة (الله) حيث يحذف اللام والهاء، وأظن هذه المشكلة بسيطة وليست ذات بال مقارنة ببقية الكلمات التي يعطيها بكل دقة ..

    قد يواجه المستخدم صعوبة مع بعض الملفات التي أنشئت باستخدام أنظمة أخرى كالويندوز والماك عند استخدام خطوط غريبة أو خاصة، أما إن كانت الخطوط قياسية مثل Arial. Tahoma . Time New Roman وغيرها من الخطوط التي تدعمها الأنظمة المختلفة فلا أعتقد أنه سيواجه مشكلة .

    ولعل ذلك درس نتعلم منه عند بناء ملفات pdf بحيث لا نستخدم سوى الخطوط المدعومة في شتى الأنظمة.

    مصدر البرنامج:

    البرنامج يتوفر على هيئة شيفرة مصدرية مفتوحة، يمكن تحميلها من موقع المشروع على الإنترنت :

    pdfedit.petricek.net

    كما قمت بتوفير حزم جاهزة

    التركيب:

    طريقة التركيب للشيفرة المصدرية تتم حسب الخطوات التالية :

    ./configure

    make

    ثم يتم الدخول بصفة المستخدم الجذر ويكتب الأمر التالي :

    make install

    والتوزيعات المبنية على شيفرة دبيان يتم تركيب البرنامج فيها بكتابة الأمر التالي :

    sudo dpkg -i pdfedit*.deb

    ويلاحظ هنا أننا قد اكتفينا بكتابة جزء من الاسم وأضفنا النجمة، هذه النجمة تكفي عن بقية الاسم.

    أما التوزيعات التي تعتمد نظام الحزم rpm فالتركيب يأخذ الصيغة التالية :

    rpm -ivh pdfedit*.rpm

    ترخيص البرنامج:

    البرنامج مفتوح المصدر، يخضع لبنود رخصة غنو العمومية الشاملة . وهو مجاني يتم الحصول عليه دون أي مقابل.

    التعامل مع البرنامج:

    يتكون البرنامج من أزرار وقوائم بسيطة، والأزرار هي جزء من وظائف القوائم، فمثلاً قائمة File تتضمن التعامل مع الملفات من فتح وحفظ، وقائمة View تتضمن التحكم بعرض الصفحات والتنقل فيما بينها إضافة إلى وظيفة البحث والتصغير والتكبير، قائمة Tools تتضمن أهم الخصائص والإعدادات الخاصة بالبرنامج ومن بينها تحديد نوع الترميز المستهدف، أما قائمة Page فيمكن وصفها بأنها عصب البرنامج وأهم وظائفه، ففيها يمكن انتزاع الكتابة من خلال وظيفة Extract text from page، ومن ضمنها اختيار الخط المناسب للصفحة، وحفظ الصفحة على هيئة صورة، كذلك والتحكم بالمقاسات، هذا بالإضافة إلى إضافة نصوص وتعليقات.

    قائمة Edit تتضمن وظائف التحرير والاختيار .

    أخيراً قائمة Help وتختص بأمور المساعدة والتعريف بالبرنامج وفريق التطوير.

    ====================

    منقول من جريدة الرياض

    http://www.alriyadh.com/2006/11/25/article204240.html
    RHCE


    Before you asking


    for q in $(ls /usr/bin/)
    do man $q
    done

  • #2
    الف شكر لك وللاستاذ خالد
    منذ فتره وانا ابحث عن مثل هذا البرنامج
    جاري التحميل والتجربه
    شكرا لك
    echo 'echo "Leastwise-Try-It-Your-Self!"' >> ~/.bashrc

    تعليق


    • #3
      مشكور اخي العزيز ابو فيصل ولولا ان الموضوع نشر اليوم فقط لكان لنا عتاب طويل مع الاخ خالد
      http://www.no4denmark.com/ar/images/...sool-allah.gif
      ((لا يومن احدكم حتى اكون احب اليه من والده وولده والناس اجمعين))......اعادوا نشر الصور فاعدنا اكل الزبدة والجبنة...

      تعليق


      • #4
        يعني مايكتب كلمة لفظ الجلالة ( الله ) تمام ؟

        تعليق


        • #5


          أشكر مشرفنا المتميز أبو فيصل على تفضله بنقل الموضوع ..
          وأشكر كل من شارك بالموضوع ..
          وبالنسبة لملاحظة الأستاذ عبدالعزيز
          فليست المسألة بعدم كتابة لفظ الجلالة يا بن العم .. لكن فيه بعض مواطن القصور في التعرف على بعض الأحرف العربية ومن ضمنها الأحرف المتكررة بشكل متتابع كلفظ الجلالة مثلاً .. إضافة إلى كلمة (لا) ..
          ونسبة الخطأ فيه مقبولة لمن يريد تحويل عمل كبير .. وهذا ما شجعني لعرضه ..

          كما قمت بتوفير حزم جاهزة لدبيان و rpm يمكن الوصول إليها عبر الوصلة التالية :
          http://almusaihij.googlepages.com/pdfedit.zip

          أجمل سلام ،،
          قال تعالى : {ولو أن أهل القرى آمنوا واتقوا لفتحنا عليهم بركات من السماء والأرض} (سورة الأعراف 96)
          http://ma3refah.net/393348.png
          سجل في عداد مستخدمي لينكس من خلال زيارة هذا الموقع :
          http://counter.li.org/enter-person.php

          تعليق


          • #6
            أنا عادة ما أستخدم أداة pdftotext (من حزمة poppler) لتحويل ملف ال pdf لملف نصي صرف وتعديله بعدها بأي محرر نصوص. العيب الوحيد أنك ستفقد أغلب تنسيق الملف وستضطر لتنسيقه يدويا، أيضا يمكنك استخراج الصور منه باستخدام pdfimages

            تعليق


            • #7
              وهل يدعم الوثائق المكتوبة بالعربية يا دكتور؟
              قال تعالى : {ولو أن أهل القرى آمنوا واتقوا لفتحنا عليهم بركات من السماء والأرض} (سورة الأعراف 96)
              http://ma3refah.net/393348.png
              سجل في عداد مستخدمي لينكس من خلال زيارة هذا الموقع :
              http://counter.li.org/enter-person.php

              تعليق


              • #8
                شكرا لك اخى بارك الله فيك
                ولكن بعدماحملت ملف المصدر حصلت مشكله اثناء التنصيب
                بعد كتابه اﻻمر configure كان الناتج
                كود:
                hecking for g++... g++
                checking for C++ compiler default output file name... a.out
                checking whether the C++ compiler works... yes
                checking whether we are cross compiling... no
                checking for suffix of executables...
                checking for suffix of object files... o
                checking whether we are using the GNU C++ compiler... yes
                checking whether g++ accepts -g... yes
                checking for gcc... gcc
                checking whether we are using the GNU C compiler... yes
                checking whether gcc accepts -g... yes
                checking for gcc option to accept ANSI C... none needed
                checking whether make sets $(MAKE)... yes
                checking for ranlib... ranlib
                checking how to run the C++ preprocessor... g++ -E
                checking for egrep... grep -E
                checking for ANSI C header files... yes
                checking for sys/types.h... yes
                checking for sys/stat.h... yes
                checking for stdlib.h... yes
                checking for string.h... yes
                checking for memory.h... yes
                checking for strings.h... yes
                checking for inttypes.h... yes
                checking for stdint.h... yes
                checking for unistd.h... yes
                checking boost/smart_ptr.hpp usability... yes
                checking boost/smart_ptr.hpp presence... yes
                checking for boost/smart_ptr.hpp... yes
                checking boost/iostreams/stream.hpp usability... yes
                checking boost/iostreams/stream.hpp presence... yes
                checking for boost/iostreams/stream.hpp... yes
                checking for ANSI C header files... (cached) yes
                checking limits.h usability... yes
                checking limits.h presence... yes
                checking for limits.h... yes
                checking for stdlib.h... (cached) yes
                checking for string.h... (cached) yes
                checking for unistd.h... (cached) yes
                checking for stdbool.h that conforms to C99... yes
                checking for _Bool... no
                checking for an ANSI C-conforming const... yes
                checking for inline... inline
                checking for size_t... yes
                checking whether struct tm is in sys/time.h or time.h... time.h
                checking for error_at_line... no
                checking for stdlib.h... (cached) yes
                checking for GNU libc compatible malloc... yes
                checking whether lstat dereferences a symlink specified with a trailing slash... yes
                checking whether stat accepts an empty string... no
                checking for strftime... yes
                checking for atexit... yes
                checking for floor... yes
                checking for ftruncate... yes
                checking for localtime_r... yes
                checking for memset... yes
                checking for mkdir... yes
                checking for strdup... yes
                checking for strerror... yes
                checking for strpbrk... yes
                checking for strstr... yes
                configure: creating ./config.status
                config.status: creating Makefile
                config.status: creating config.pro.in
                config.status: creating src/utils/aconf.h
                config.status: src/utils/aconf.h is unchanged
                config.status: executing default commands
                ثم كتبت اﻻمر make
                كان الناتج ان فيه error
                كود:
                cd doc && ( gmake doc_dist|| make doc_dist )
                gmake[1]: Entering directory `/home/Amr/pdfedit-0.2.2/doc'
                cd user && ( gmake all_no_pdf || make all_no_pdf )
                gmake[2]: Entering directory `/home/Amr/pdfedit-0.2.2/doc/user'
                gmake[2]: Nothing to be done for `all_no_pdf'.
                gmake[2]: Leaving directory `/home/Amr/pdfedit-0.2.2/doc/user'
                cd design && ( gmake all_no_pdf || make all_no_pdf )
                gmake[2]: Entering directory `/home/Amr/pdfedit-0.2.2/doc/design'
                gmake[2]: Nothing to be done for `all_no_pdf'.
                gmake[2]: Leaving directory `/home/Amr/pdfedit-0.2.2/doc/design'
                gmake[1]: Leaving directory `/home/Amr/pdfedit-0.2.2/doc'
                cd src && make
                make[1]: Entering directory `/home/Amr/pdfedit-0.2.2/src'
                cd xpdf && make libxpdf
                make[2]: Entering directory `/home/Amr/pdfedit-0.2.2/src/xpdf'
                cd goo; make
                make[3]: Entering directory `/home/Amr/pdfedit-0.2.2/src/xpdf/goo'
                make[3]: Nothing to be done for `all'.
                make[3]: Leaving directory `/home/Amr/pdfedit-0.2.2/src/xpdf/goo'
                cd fofi; make
                make[3]: Entering directory `/home/Amr/pdfedit-0.2.2/src/xpdf/fofi'
                make[3]: Nothing to be done for `all'.
                make[3]: Leaving directory `/home/Amr/pdfedit-0.2.2/src/xpdf/fofi'
                cd splash; make
                make[3]: Entering directory `/home/Amr/pdfedit-0.2.2/src/xpdf/splash'
                make[3]: Nothing to be done for `all'.
                make[3]: Leaving directory `/home/Amr/pdfedit-0.2.2/src/xpdf/splash'
                cd xpdf; make libxpdf
                make[3]: Entering directory `/home/Amr/pdfedit-0.2.2/src/xpdf/xpdf'
                make[3]: Nothing to be done for `libxpdf'.
                make[3]: Leaving directory `/home/Amr/pdfedit-0.2.2/src/xpdf/xpdf'
                make[2]: Leaving directory `/home/Amr/pdfedit-0.2.2/src/xpdf'
                cd utils && make
                make[2]: Entering directory `/home/Amr/pdfedit-0.2.2/src/utils'
                make[2]: `libutils.a' is up to date.
                make[2]: Leaving directory `/home/Amr/pdfedit-0.2.2/src/utils'
                cd kernel && qmake && make staticlib
                /bin/sh: qmake: command not found
                make[1]: *** [kernel] Error 127
                make[1]: Leaving directory `/home/Amr/pdfedit-0.2.2/src'
                make: *** [src] Error 2
                كيف اعالج ذالك
                http://img197.imageshack.us/img197/9...66319499rr.gif

                lion_heart_300 previously

                تعليق


                • #9
                  تأكد من تحميل qt-devel وبعد التنصيب احذف المجلد الناتج بعد فك الضغط واستخرج محتويات الملف المضغوط مجدداً وأعد العملية

                  أخوك محمد ،،،
                  RHCE


                  Before you asking


                  for q in $(ls /usr/bin/)
                  do man $q
                  done

                  تعليق


                  • #10
                    الحزمة qt-devel موجودة في أقراص توزيعتك وإن أردت تحميلها من النت فلا تقم بتحميل الإصدار الرابع منها qt4-devel ﻷنه لن يفيدك مع هذا البرنامج

                    أخوك محمد ،،،
                    RHCE


                    Before you asking


                    for q in $(ls /usr/bin/)
                    do man $q
                    done

                    تعليق


                    • #11
                      نفس الخطا اخى
                      شكرا
                      http://img197.imageshack.us/img197/9...66319499rr.gif

                      lion_heart_300 previously

                      تعليق


                      • #12
                        pdftotext في حزمة poppler (وليس xpdf) يدعم العربية مع نفس المشكلة المذكورة هنا

                        تعليق


                        • #13
                          المشاركة الأصلية بواسطة lion_heart_300 مشاهدة المشاركة
                          نفس الخطا اخى
                          شكرا

                          دعك من الشيفرة المصدرية وجرب مايناسب توزيعتك من الحزم الجاهزة التي أرفقتها بمشاركتي الأولى وستكون الأمور على مايرام بإذن الله تعالى ،،
                          قال تعالى : {ولو أن أهل القرى آمنوا واتقوا لفتحنا عليهم بركات من السماء والأرض} (سورة الأعراف 96)
                          http://ma3refah.net/393348.png
                          سجل في عداد مستخدمي لينكس من خلال زيارة هذا الموقع :
                          http://counter.li.org/enter-person.php

                          تعليق


                          • #14
                            المشاركة الأصلية بواسطة dr_tux مشاهدة المشاركة
                            pdftotext في حزمة poppler (وليس xpdf) يدعم العربية مع نفس المشكلة المذكورة هنا
                            قد تكون الشيفرة واحدة ..
                            على العموم أرجو أن تتكرم بتزويدي بوصلة التحميل ..
                            مع خالص التقدير ،،
                            قال تعالى : {ولو أن أهل القرى آمنوا واتقوا لفتحنا عليهم بركات من السماء والأرض} (سورة الأعراف 96)
                            http://ma3refah.net/393348.png
                            سجل في عداد مستخدمي لينكس من خلال زيارة هذا الموقع :
                            http://counter.li.org/enter-person.php

                            تعليق


                            • #15
                              http://poppler.freedesktop.org
                              ملحوظه، هذه برامج تعمل من سطر الأوامر وغالبا هي مثبتة في توزيعتك لأن كثيرا من البرامج التي تتعامل مع ملفات pdf تعتمد عليها، وقد يكون هذا هو سبب تشابه الخطأ

                              تعليق

                              يعمل...
                              X