સમસ્યા નિવેદન
ચાલો ધારીએ કે અમારી પાસે સમય શ્રેણીનો ડેટાસેટ છે જેમાં એક વર્ષ માટે રિટેલ સ્ટોરના દૈનિક વેચાણના આંકડાઓ છે. અમારું કાર્ય આ ડેટાસેટનું વિશ્લેષણ કરવાનું છે અને સંભવિત વિસંગતતાઓને સરળ બનાવવા, વલણોને ઓળખવા અને વ્યવસાયિક નિર્ણયોનું માર્ગદર્શન કરવા માટે વેચાણની 7-દિવસની રોલિંગ સરેરાશની ગણતરી કરવાનું છે. અમે ડેટા પૃથ્થકરણ માટે જાણીતી અને વ્યાપકપણે ઉપયોગમાં લેવાતી પ્રોગ્રામિંગ ભાષા પાયથોનનો ઉપયોગ કરીશું.
ઉકેલ અભિગમ
રોલિંગ વિન્ડોની સમસ્યાને ઉકેલવા માટે, અમે આ પગલાંને અનુસરીશું:
- જરૂરી પુસ્તકાલયો આયાત કરો
- ડેટાસેટ લોડ કરો
- રોલિંગ વિન્ડો બનાવો
- 7-દિવસની મૂવિંગ એવરેજની ગણતરી કરો
- પરિણામોની કલ્પના કરો
ચાલો જરૂરી પુસ્તકાલયો આયાત કરવા અને ડેટાસેટ લોડ કરવા સાથે પ્રારંભ કરીએ.
import pandas as pd import numpy as np import matplotlib.pyplot as plt # Load dataset (Assuming the dataset is a CSV file) data = pd.read_csv('sales_data.csv') # Preview the dataset print(data.head())
ડેટાસેટ લોડ કર્યા પછી, હવે અમે રોલિંગ વિન્ડો બનાવવા માટે આગળ વધીએ છીએ.
રોલિંગ વિન્ડો બનાવી રહ્યા છીએ
અમે શક્તિશાળી તરફ વળીએ છીએ પાંડા નો ઉપયોગ કરીને રોલિંગ વિન્ડો બનાવવા માટે પુસ્તકાલય rolling()
કાર્ય રોલિંગ વિન્ડોની સાઇઝ 7 દિવસની હશે, કારણ કે આપણે 7-દિવસની મૂવિંગ એવરેજની ગણતરી કરવા માંગીએ છીએ.
# Create a rolling window of 7 days rolling_window = data['sales'].rolling(window=7)
હવે અમારી પાસે રોલિંગ વિન્ડો છે, અમે 7-દિવસની મૂવિંગ એવરેજની ગણતરી કરી શકીએ છીએ.
7-દિવસની મૂવિંગ એવરેજની ગણતરી
વેચાણની 7-દિવસની મૂવિંગ એવરેજ શોધવા માટે, અમે ફક્ત કૉલ કરો mean()
અમારા રોલિંગ વિન્ડો ઑબ્જેક્ટ પર કાર્ય. પછી અમે આ નવી મૂવિંગ એવરેજને અમારા ડેટાસેટમાં નવી કૉલમ તરીકે ઉમેરીએ છીએ.
# Calculate the moving average data['7_day_avg'] = rolling_window.mean() # Preview the updated dataset print(data.head(10))
છેલ્લે, ચાલો અમારા ડેટાના વલણોને વધુ સારી રીતે સમજવા માટે અમારા પરિણામોની કલ્પના કરીએ.
વિઝ્યુઅલાઈઝ પરિણામો
અમે લોકપ્રિયનો ઉપયોગ કરીશું મેટપ્લોટલિબ દૈનિક વેચાણ ડેટા અને અમારી ગણતરી કરેલ 7-દિવસની મૂવિંગ એવરેજ બંનેને દર્શાવતો સરળ લાઇન ચાર્ટ બનાવવા માટે લાઇબ્રેરી.
# Plot the daily sales data plt.plot(data['sales'], label='Daily Sales') # Plot the 7-day moving average plt.plot(data['7_day_avg'], label='7-Day Moving Average', color='red') # Add labels and legend plt.xlabel('Days') plt.ylabel('Sales') plt.title('Daily Sales and 7-Day Moving Average') plt.legend() # Display the plot plt.show()
જનરેટ કરેલ ચાર્ટ 7-દિવસની મૂવિંગ એવરેજ સાથે દૈનિક વેચાણ ડેટા દર્શાવે છે, જે અમારા માટે વલણો અને વિસંગતતાઓને ઓળખવાનું સરળ બનાવે છે.
નિષ્કર્ષમાં, રોલિંગ વિન્ડોનો વ્યાપકપણે ડેટા વિશ્લેષણમાં ઉપયોગ થાય છે, ખાસ કરીને સમય શ્રેણી, મોટા ડેટાસેટ્સમાં છુપાયેલા દાખલાઓ અને વલણોને જાહેર કરવાની તેની ક્ષમતા માટે. Python, Pandas અને Matplotlib નું સંયોજન મૂવિંગ એવરેજની ગણતરી કરવાની અને પરિણામોને વિઝ્યુઅલાઈઝ કરવાની પ્રક્રિયાને સરળ બનાવે છે, જે તેને ક્ષેત્રના નવા નિશાળીયા અને નિષ્ણાતો બંને માટે સંપર્ક કરી શકાય તેવો વિષય બનાવે છે.