বিষয়বস্তুতে চলুন

ইন্দ্রিয়তন্ত্র/দৃষ্টিতন্ত্র/চিত্র প্রক্রিয়াকরণ

উইকিবই থেকে

চিত্র প্রক্রিয়াকরণ

[সম্পাদনা]

একটি গুরুত্বপূর্ণ প্রযুক্তিগত বিষয় হলো কম্পিউটার কীভাবে ছবি পরিচালনা করে তা বোঝা। ছবি সম্পাদনা করার পদ্ধতি এবং ছবি পুনর্বিন্যাস করার কৌশলগুলো আমাদের জানতে হবে।

চিত্র উপস্থাপনা

[সম্পাদনা]

গ্রে স্কেল

[সম্পাদনা]

কম্পিউটারের জন্য একটি ছবি হলো অসংখ্য ছোট ছোট বর্গের সমষ্টি। এই বর্গগুলোকে "পিক্সেল" বলা হয়। একটি গ্রে স্কেল ছবিতে, প্রতিটি পিক্সেল একটি নির্দিষ্ট সংখ্যা 'n' ধারণ করে, যা প্রায়শই এর মধ্যে থাকে। এই সংখ্যা 'n' ছবিটির সেই নির্দিষ্ট বর্গের সঠিক রঙ নির্দেশ করে। এর অর্থ হলো, একটি গ্রে স্কেল ছবিতে আমরা ২৫৬টি ভিন্ন গ্রে স্কেল ব্যবহার করতে পারি, যেখানে ২৫৫ মানে একটি সাদা বিন্দু এবং ০ মানে বর্গটি কালো। সত্যি বলতে, আমরা ২৫৬টির বেশি ভিন্ন গ্রে স্কেলও ব্যবহার করতে পারি। উল্লিখিত পদ্ধতিতে, প্রতিটি পিক্সেল সংরক্ষণের জন্য ঠিক ১ বাইট (বা ৮ বিট) মেমরি ব্যবহার করে। (কম্পিউটারের বাইনারি সিস্টেম অনুসারে: ২=২৫৬)। যদি আপনি মনে করেন আপনার ছবিতে আরও ভিন্ন গ্রে স্কেলের প্রয়োজন, তবে এটি কোনো সমস্যা নয়। ছবিটি সংরক্ষণের জন্য আপনি আরও মেমরি ব্যবহার করতে পারেন। তবে মনে রাখবেন, বিশাল আকারের ছবির জন্য এটি একটি কঠিন কাজ হতে পারে। এছাড়াও, প্রায়শই একটি সমস্যা দেখা যায় যে আপনার সেন্সিং ডিভাইস (যেমন আপনার মনিটর) এই ২৫৬টির বেশি ভিন্ন গ্রে রঙ দেখাতে পারে না।

রঙিন ছবি উপস্থাপন করা গ্রে স্কেল ছবির চেয়ে সামান্য জটিল। আপনাকে শুধু জানতে হবে যে কম্পিউটার লাল, সবুজ এবং নীল এই তিনটি প্রধান রঙের সংযোজন মিশ্রণ ব্যবহার করে কাজ করে। এগুলোকে আরজিবি রঙ বলা হয়।

এই ছবিগুলোও পিক্সেল দ্বারা সংরক্ষিত হয়। কিন্তু এখন প্রতিটি পিক্সেলকে ০ থেকে ২৫৬ এর মধ্যে ৩টি মান জানতে হয়, প্রতিটি রঙের জন্য ১টি করে মান। সুতরাং এখন আমরা ২৫৬=১৬,৭৭৭,২১৬ ভিন্ন রঙ উপস্থাপন করতে পারি। গ্রে স্কেল ছবির মতোই এখানেও প্রযোজ্য যে, কোনো রঙ না থাকলে কালো এবং সব রঙ থাকলে সাদা বোঝায়। অর্থাৎ, (০,০,০) রঙটি কালো, যেখানে (০,০,২৫৫) নীল এবং (২৫৫,২৫৫,২৫৫) সাদা।

ইমেজ ফিল্টারিং

[সম্পাদনা]

১ডি ফিল্টার

[সম্পাদনা]

আরও ভালোভাবে বোঝার জন্য, একটি উদাহরণ দেখা যাক। ১ডি (1D) ক্ষেত্রে আমরা সাধারণত ভেক্টরের সাথে কাজ করি। ধরা যাক, একটি প্রদত্ত ভেক্টর হলো । আমাদের উদ্দেশ্য হলো এই ভেক্টর x কে মসৃণ করা।

এটি করার জন্য আমাদের আরেকটি ভেক্টর দরকার, যার নাম । এই ভেক্টরটিকে আমরা ওয়েট ভেক্টর বলি।

এখন, ব্যবহার করে আমরা একটি মসৃণ ভেক্টর y পাই। এই ভেক্টরটি পূর্ববর্তী ভেক্টরের চেয়ে মসৃণ, কারণ আমরা ভেক্টরের কয়েকটি এন্ট্রির গড় মান সংরক্ষণ করছি। এর অর্থ হলো, নতুন প্রাপ্ত ভেক্টর এন্ট্রিগুলো মসৃণ করা এন্ট্রির বাম এবং ডান দিকের কিছু এন্ট্রির উপর নির্ভর করে। এই পদ্ধতির একটি প্রধান অসুবিধা হলো, নতুন প্রাপ্ত ভেক্টর y-এর এন্ট্রি সংখ্যা মূল ভেক্টর x-এর মতো n টি না হয়ে শুধু n−m টি হয়।

এই নতুন ভেক্টরটি আঁকলে আগের ফাংশনের মতোই দেখাবে, শুধু বিস্তার কম হবে। অর্থাৎ, কোনো ডেটা হারাবে না, কিন্তু ওঠানামা কম হবে।

২ডি ফিল্টার

[সম্পাদনা]

১ডি (1D) কেস থেকে ২ডি (2D) কেসে যাওয়া হয় সহজভাবে ভেক্টরকে ম্যাট্রিক্সে রূপান্তরিত করে। যেমনটি আগেই উল্লেখ করা হয়েছে, একটি গ্রে-লেভেল ইমেজ কম্পিউটার বা ম্যাটল্যাবের (MATLAB) মতো সফটওয়্যার টুলের কাছে প্রাকৃতিক সংখ্যায় ভরা একটি বিশাল ম্যাট্রিক্স ছাড়া আর কিছুই নয়, যা প্রায়শই ০ থেকে ২৫৫ এর মধ্যে থাকে।

ওয়েট ভেক্টরটি এখন একটি ওয়েট-ম্যাট্রিক্স। কিন্তু এখনও আমরা বিভিন্ন ম্যাট্রিক্স-এলিমেন্ট-গুণন যোগ করে ফিল্টারটি ব্যবহার করি।

এখানে সূত্রটি হলো:

প্রসারণ এবং ক্ষয়

[সম্পাদনা]

আগে দেখা লিনিয়ার ফিল্টারগুলির জন্য, এটি প্রযোজ্য যে তারা কমিউটেটিভ (commutativ)। উইকিপিডিয়া থেকে উদ্ধৃতি: "কেউ বলে যে x, y এর সাথে ∗ এর অধীনে কমিউট করে যদি:

"

অন্যভাবে বলতে গেলে, আপনি যতগুলো এবং যে ক্রমে বিভিন্ন লিনিয়ার ফিল্টার ব্যবহার করেন না কেন, তা গুরুত্বপূর্ণ নয়। যেমন, যদি কোনো ডেটাতে একটি স্যাভিটস্কি-গোলে ফিল্টার প্রয়োগ করা হয় এবং তারপর প্রথম ডেরিভেটিভ গণনার জন্য দ্বিতীয় একটি স্যাভিটস্কি-গোলে ফিল্টার প্রয়োগ করা হয়, তবে ফিল্টারগুলির ক্রম উল্টে দিলেও ফলাফল একই হবে। এমনকি এটিও প্রযোজ্য যে, একটি একক ফিল্টার থাকবে যা প্রয়োগ করা দুটি ফিল্টারের একই কাজ করবে।

এর বিপরীতে, একটি চিত্রের ওপর মর্ফোলজিক্যাল অপারেশন হলো নন-লিনিয়ার অপারেশন এবং এর চূড়ান্ত ফলাফল ক্রমের ওপর নির্ভরশীল। যদি আমরা যেকোনো একটি চিত্রের কথা ভাবি, তবে সেটি xij মানসম্পন্ন পিক্সেল দ্বারা সংজ্ঞায়িত হয়। উপরন্তু, এই চিত্রটি একটি সাদা-কালো চিত্র বলে ধরে নেওয়া হয়েছে, তাই আমাদের আছে:

একটি মর্ফোলজিক্যাল অপারেশন সংজ্ঞায়িত করার জন্য আমাদের একটি স্ট্রাকচারাল এলিমেন্ট (SE) নির্ধারণ করতে হবে। উদাহরণস্বরূপ, ছবির একটি অংশ হিসেবে একটি ৩x৩ ম্যাট্রিক্স।

ইরোজন E এর সংজ্ঞা হলো:

.

সুতরাং, কথায় বলতে গেলে, যদি স্ট্রাকচারাল এলিমেন্ট M-এর যেকোনো পিক্সেলের মান 0 হয়, তাহলে ইরোজন M-এর একটি নির্দিষ্ট পিক্সেলের মানকে শূন্যতে (0) সেট করে। অন্যথায়, E(M)=1 হবে।

আর ডাইলেশন D এর ক্ষেত্রে, যদি স্ট্রাকচারাল এলিমেন্ট (SE)-এর যেকোনো মান 1 হয়, তাহলে M-এর ডাইলেশন, D(M), কে 1-এ সেট করা হয়।

.


ডাইলেশন এবং ইরোজন এর সংমিশ্রণ: ছবির ওপেনিং এবং ক্লোজিং

[সম্পাদনা]

ডাইলেশন এবং ইরোজন এর দুটি সংমিশ্রণ রয়েছে। একটিকে ওপেনিং এবং অন্যটিকে ক্লোজিং বলা হয়। এদের সম্পর্ক নিম্নরূপ: