પાયથોનમાં સરેરાશ, મધ્ય અને સ્થિતિ શોધવી: ડેટાનું વિશ્લેષણ કરવા પર એક વ્યાપક માર્ગદર્શિકા
ડેટા વિશ્લેષણ એ ડેટાસેટ્સને સમજવા અને અર્થઘટનનો આવશ્યક ભાગ છે. ડેટા વિશ્લેષણનું એક મૂળભૂત પાસું એ ડેટાના સરેરાશ, મધ્ય અને મોડની ગણતરી છે. આ ત્રણ પગલાં કેન્દ્રીય વલણોનું પ્રતિનિધિત્વ કરે છે અને ડેટામાં વલણો અને પેટર્નને ઓળખવામાં ઉપયોગી છે. આ લેખમાં, અમે સરેરાશ, મધ્યક અને મોડની વિભાવનાઓ અને પાયથોનનો ઉપયોગ કરીને તેમની ગણતરી કેવી રીતે કરવી તે શોધીશું. અમે સમાન સમસ્યાઓના નિરાકરણમાં સામેલ વિવિધ પુસ્તકાલયો અને કાર્યોની પણ ચર્ચા કરીશું.
**મીન** એ ડેટાસેટનું સરેરાશ મૂલ્ય છે, જે મૂલ્યોના સરવાળાને ડેટાસેટમાં મૂલ્યોની સંખ્યા દ્વારા વિભાજિત કરીને ગણવામાં આવે છે. **મધ્યમ** એ ડેટાસેટનું મધ્યમ મૂલ્ય છે જ્યારે તેને ચડતા અથવા ઉતરતા ક્રમમાં સૉર્ટ કરવામાં આવે છે. જો ડેટાસેટમાં વિચિત્ર સંખ્યાના મૂલ્યો હોય, તો મધ્યક એ મૂલ્ય છે જે બરાબર મધ્યમાં આવેલું છે, જ્યારે સમાન સંખ્યાના મૂલ્યો માટે, મધ્ય એ બે મધ્યમ મૂલ્યોની સરેરાશ છે. **મોડ** એ મૂલ્ય(ઓ)નો સંદર્ભ આપે છે જે ડેટાસેટમાં સૌથી વધુ વાર જોવા મળે છે.
આ પગલાંની ગણતરી કરવા માટે, અમે પાયથોન પ્રોગ્રામ લખીશું જે ઇનપુટ તરીકે સંખ્યાઓની સૂચિ લે છે અને સરેરાશ, મધ્ય અને મોડ પરત કરે છે. ચાલો આ ઉકેલને અમલમાં મૂકવા માટે એક પગલું-દર-પગલાં અભિગમને અનુસરીએ.
# Step 1: Define a function to calculate the mean def calculate_mean(numbers): return sum(numbers) / len(numbers) # Step 2: Define a function to calculate the median def calculate_median(numbers): sorted_numbers = sorted(numbers) length = len(numbers) mid_index = length // 2 if length % 2 == 0: median = (sorted_numbers[mid_index - 1] + sorted_numbers[mid_index]) / 2 else: median = sorted_numbers[mid_index] return median # Step 3: Define a function to calculate the mode def calculate_mode(numbers): from collections import Counter count = Counter(numbers) mode = count.most_common(1)[0][0] return mode # Step 4: Implement the main function def main(): numbers = [int(x) for x in input("Enter numbers separated by spaces: ").split()] mean = calculate_mean(numbers) median = calculate_median(numbers) mode = calculate_mode(numbers) print("Mean:", mean) print("Median:", median) print("Mode:", mode) if __name__ == "__main__": main()
ઉપરોક્ત કોડ ચાર પગલાઓનો સમાવેશ કરે છે. પ્રથમ, અમે સંખ્યાઓની સૂચિના સરેરાશની ગણતરી કરવા માટે ફંક્શનને વ્યાખ્યાયિત કરીએ છીએ. બીજા પગલામાં, અમે મધ્યકની ગણતરી કરવા માટે અન્ય કાર્યને વ્યાખ્યાયિત કરીએ છીએ. આ ફંક્શન ઇનપુટ સૂચિને સૉર્ટ કરે છે અને સૂચિની લંબાઈના આધારે મધ્યમ મૂલ્ય શોધે છે. ત્રીજા પગલામાં, અમે કલેક્શન મોડ્યુલમાંથી કાઉન્ટર ક્લાસનો ઉપયોગ કરીને મોડની ગણતરી કરવા માટે ફંક્શન બનાવીએ છીએ. છેલ્લા પગલામાં મુખ્ય કાર્યને વ્યાખ્યાયિત કરવાનો સમાવેશ થાય છે, જે વપરાશકર્તા ઇનપુટ લે છે, અગાઉ નિર્ધારિત કાર્યોને કૉલ કરે છે અને ઇનપુટ ડેટાના સરેરાશ, મધ્ય અને મોડને આઉટપુટ કરે છે.
આંકડા અને ડેટા વિશ્લેષણ માટે પાયથોન લાઇબ્રેરીઓ
પાયથોન ઓફર કરે છે બહુવિધ પુસ્તકાલયો જે આંકડાકીય વિશ્લેષણ અને ડેટાની હેરફેરમાં મદદ કરે છે. કેટલીક લોકપ્રિય પુસ્તકાલયોમાં શામેલ છે:
- નમy - સંખ્યાત્મક ગણતરીઓ, એરેની હેરફેર અને રેખીય બીજગણિત માટે એક શક્તિશાળી પુસ્તકાલય.
- પાંડા - એક લવચીક પુસ્તકાલય જે ડેટાફ્રેમ સ્ટ્રક્ચર્સનો ઉપયોગ કરીને ડેટા મેનીપ્યુલેશન અને વિશ્લેષણ ક્ષમતાઓ પ્રદાન કરે છે.
- સાયપી – ઓપ્ટિમાઇઝેશન, ઇન્ટિગ્રેશન, ઇન્ટરપોલેશન અને ઘણું બધું સહિત વૈજ્ઞાનિક કમ્પ્યુટિંગ સાથે કામ કરતી લાઇબ્રેરી.
મીન, મધ્ય અને સ્થિતિની ગણતરી માટે નમ્પી અને પાંડાનો ઉપયોગ કરવો
મૂળભૂત પાયથોન અમલીકરણ ઉપરાંત, અમે સરેરાશ, મધ્ય અને મોડની અસરકારક રીતે ગણતરી કરવા માટે Numpy અને Pandas લાઇબ્રેરીઓનો ઉપયોગ કરી શકીએ છીએ.
ડેટાસેટ માટે આ કેન્દ્રીય વલણોની ગણતરી કરવા માટે Numpy અને Pandas નો ઉપયોગ કેવી રીતે કરવો તેનું ઉદાહરણ નીચે છે:
import numpy as np import pandas as pd data = [4, 2, 7, 3, 9, 1, 6, 5, 8] # Using Numpy mean_numpy = np.mean(data) median_numpy = np.median(data) # Using Pandas data_series = pd.Series(data) mode_pandas = data_series.mode().tolist() print("Mean (Numpy):", mean_numpy) print("Median (Numpy):", median_numpy) print("Mode (Pandas):", mode_pandas)
ઉપરના ઉદાહરણમાં, અમે અનુક્રમે સરેરાશ અને મધ્યની ગણતરી કરવા માટે Numpy ફંક્શન્સ `mean()` અને `Median()` નો ઉપયોગ કરીએ છીએ. મોડ માટે, અમે અમારા ડેટાને Pandas સિરીઝમાં કન્વર્ટ કરીએ છીએ અને `mode()` ફંક્શનનો ઉપયોગ કરીએ છીએ, જે મોડ્સની સૂચિ આપે છે.
આ લેખ સરેરાશ, મધ્યક અને મોડની વિભાવનાઓની વ્યાપક સમજ પ્રદાન કરે છે અને મૂળભૂત પાયથોન અને લોકપ્રિય પાયથોન લાઇબ્રેરીઓ બંનેનો ઉપયોગ કરીને તેમની ગણતરી કેવી રીતે કરવી. આ અભિગમોનો ઉપયોગ કરીને, ડેટા વિશ્લેષકો અર્થપૂર્ણ તારણો કાઢવા અને ડેટામાં વલણોને ઓળખવા માટે ડેટાસેટ્સનું અસરકારક રીતે વિશ્લેષણ અને અર્થઘટન કરી શકે છે.