در این آموزش از یک نرم افزار رایگان و چند منظوره به اسم"Bytescout PDF " برای این کار استفاده کرده ایم. با استفاده از این قابلیت، نرم افزار به طور خودکار جداول را در فایل pdf تشخیص میدهد و هنگامی که جدول شناسایی شد، شما باید محل ذخیره جدول را انتخاب کنید. شما همچنین می توانید فرمت خروجی که شامل TXT، CSV، XML، JSON، یا XLS را انتخاب کنید.
در طول آزمایش، تمام جداول من با استفاده از این برنامه استخراج شد، اما برخی از محتوای متن نیز در خروجی وجود داشت. بنابراین، این نرم افزار کاملا کار نمی کند اما می توان بطور 90 درصد کار شما را انجام دهد
این نرم افزار تنظیماتی برای دقت بیشتر در خروجی جداول دارد به عنوان مثال شما می توانید حداقل تعداد سطرها، ستون ها، حداقل خط بین جداول، و غیره را برای تشخیص جدول مشخص کنید. بنابراین،هر چقدر این تنظیمات را دقیق تر انجام دهید برنامه هم خروجی دقیق تری به شما میدهد.
یک فایل pdf دو صفحه ای یا چند صفحه ای که در آن جدول وجود داشته باشد را آماده کنید
قدم سوم:
در بخش سمت چپ رابط کاربری آن دارای گزینه های متعدد با دسته بندی های مختلف است . شما بر روی گزینه تشخیص جداول(Detect tables) از زیر دسته استخراج داده ها(Data Extraction) کلیک کنید
قدم چهارم:
پنجره کوچکی باز خواهد شد و این پنجره شامل گزینه های متعددی که به تشخیص جدول و استخراج آن مرتبط است را به شما نمایش میدهد، شما می توانید این گزینه ها را طبق نیاز خود مدیریت کنید. برخی از گزینه های مهم عبارتند از:
تنظیم حداقل تعداد سطر و ستون برای تشخیص جدول.
تنظیم حداکثر مجاز ردیف
حالت تشخیص ستون: که پیشنهاد میکنم حالت پیش فرض یعنی گزینه اول را انتخاب نمایید
قدم پنجم:
بر روی گزینه Detect next table کلیک کنید و منتظر شناسایی و بررسی فایل pdf شوید
قدم ششم:
بعد از اتمام شناسایی بر روی گزینه Proceed to extraction کلیک کنید و فرمت خروجی خود را انتخاب کنید
زمانی که فرمت مورد نظر خود را انتخاب میکنیدچند گزینه برای شما نمایش داده میشود
قالب بندی متن نگه داشته شود
نسبت فاصله بین ستون ها.
و چند گزینه دیگر که با کمی بررسی میتوانید متوجه کارایی آنها شوید
بعد از اعمال تنظیمات بر روی Extract to File کلیک و جداول خود را تحویل بگیرید
نتیجه گیری:
شاید برنامه های زیادی برای ویرایش pdf وجود داشته باشد ولی این برنامه ویژگی کاملا منحصر بفردی را داراست و آن بصورت خودکار اقدام به جدا سازی تمام جداول موجود در فایلهای pdf در فرمت انتخابی شماست دومین نکته رایگان بودن برنامه است
اگر مطلب فوق برای شما مفید بوده است لطفا چنانچه برای شما مقدور است از "ما" حمایت کنید.
با نظر دادن، من را در بهتر شدن مطالب وبسایت یاری کنید با تشکر
با توجه با اینکه نظرات خصوصی شما امکان نمایش در سایت ندارد بنابراین اگر احساس میکنید نظر و یا سوال شما برای سایر کاربران نیز مفید است لطفا در قسمت ارسال نظر، گزینه "" را تیک نزنید.
هرگونه کپی برداری بدون اجازه غیر مجاز و خلاف شرع است