Sunday, May 9, 2021

Pandas Tutorial                      

Pandas:

        Working with Data sets and Arrays for analyze, clean, and manipulating Data. 

  Import Pandas:

    Coding

        Import pandas as pd  


Example 

Checking pandas version

         Coding

                import pandas as pd

                print(pd.__version__)

This coding used to know about our pandas versions.


Data Frames:

        Example 1:

       Coding

            import pandas as pd

            mydataset = { 'TVs': ["Sony", "Samsung", "LG"], 'Passings': [3, 7, 2]

                                  }

            myvar = pd.DataFrame(mydataset)

            print(myvar)

Output:

                                Tvs                            Passings

            0           Sony                                        3

            1           Samsung                                 7

            2           LG                                           2

In this example we set the data's into data frames

pd.DataFrame(mydataset) Used to set data frames


Find Location:
            
            Coding
                        
                        print(df.loc[1])
Output:

                       TVs Samsung
            Passings          7
            Name: 1, dtype: object

Read CSV File:
                We use csv files or excel, sheets for the data analysis.
                 These files having all the details of the project what we done.
                Store big data's into this csv files.
Example:
               import pandas as pd

        df = pd.read_csv('example.csv')

        print(df.to_string()) 

Output:
            Tvs                            Passings

            0           Sony                                        3

            1           Samsung                                 7

            2           LG                                           2

            3           Panasonic                                4

            4           Mi                                             6

            5           Sansui                                       5

In this Example we read the csv file by using pd.read_csv('example.csv').

It will analyse the all data in the csv file and show all the data's.

Read Json File:

Example:
          import pandas as pd

     df = pd.read_json('Example.json')

     print(df.to_string()) 

Output:
                             Tvs                            Passings

            0           Sony                                        3

            1           Samsung                                 7

            2           LG                                           2

            3           Panasonic                                4

            4           Mi                                             6

            5           Sansui                                       5

In this example we using Json Files.                    
JavaScript Object Notation(JSON) lightweight format for storing and transporting data.
We can resd the Json files by using pd.read_json('Example.json')

Viewing The Data's

head() Function:

Example:
        import pandas as pd

        df = pd.read_csv('Example.csv')

        print(df.head(3))

Output:
                            Tvs                            Passings

            0           Sony                                        3

            1           Samsung                                 7

            2           LG                                           2

head () function used to show first 3 data's of the csv file.

Tail() Function:

               import pandas as pd

        df = pd.read_csv('Example.csv')

        print(df.tail(3))
Output:
                
            3           Panasonic                                4

            4           Mi                                             6

            5           Sansui                                       5

In this tail function used show last data's of the csv file.

Cleaning Data:

            Data cleaning is the process of remove empty cells, Wrong data's, Wrong format data, Duplicate Data's.

Example:
               import pandas as pd

        df = pd.read_csv('example.csv')

        new_df = df.dropna()

        print(new_df.to_string())

dropna() function is used to remove empty cells from our data's.

Wrong format data Correction:

 Example:

        import pandas as pd

    df = pd.read_csv('example.csv')

    df['Date'] = pd.to_datetime(df['Date'])

    print(df.to_string())

Convert wrong format of data into correct format.

In this exapmle used to convert correct format of date.

Wrong Data Correction:

        df.loc[4'Duration'] = 8

In this example we correct the data by its location.

Remove Duplicates:
       
         print(df.duplicated())

this line used to find duplicates.

         df.drop_duplicates(inplace = True)

this line used to drop duplicates.

Correlation:

            df.corr()

this line used to correlate the columns of the datasets.

No comments:

Post a Comment

Python Technical Interview Questions

 1)first non repeating character Malayalam y programming p str = "MalayalaM" a = '\0' for c in str:     if str.index(c) ==...