Yêu cầu thg 10 21, 2019 9:52 SA 96 0 1
  • 96 0 1
0

lấy dữ liệu sử dụng pandas

Chia sẻ
  • 96 0 1

Có anh chị nào đã từng xử lý lỗi này ko ạ. E sử dụng pandas để lấy dữ liệu mà bị lỗi Nan. A chị xem code chỉ giúp e với ạ

mport pandas as pd
import matplotlib.pyplot as plt
a = pd.read_excel('bkct.xlsm',header=9,encoding='utf-8')
print(a.info())print(a[['ĐT Nợ','YT Nợ','Tiền hàng VAT']].dropna())
print(a.info())
Yếu tố 2            10845 non-null object
Tiền hàng VAT       982 non-null float64

E sử dụng dropna đẻ loại bỏ các dòng " Nan "mà ko được ạ Mong các cao nhân chỉ giúp e với ạ

1 CÂU TRẢ LỜI


Đã trả lời thg 10 21, 2019 9:56 SA
Đã được chấp nhận
+3

Khi bạn sử dụng dropna(), pandas sẽ trả lại cho bạn một cái bảng mới không có NaNkhông sửa thẳng vào bảng cũ. Vậy nên, khi bạn print lại, bảng cũ sẽ vẫn có NaN.

Để tránh việc này, bạn có thể viết đè lên bảng cũ:

a = a.dropna()

hoặc sử dụng lựa chọn có sẵn của pandas:

a.dropna(inplace=True)

lưu ý: trong code của bạn hiện tại đang thiếu một dấu xuống dòng trước dòng print. đồng thời, bạn có 3 dòng print mà output ngắn quá, bạn có đang copy thiếu gì không?

Chia sẻ
thg 10 21, 2019 3:50 CH

cám ơn bạn nhưng vẫn ko được ạ kết quả trả về là Empty DataFrame Columns: [ĐT Nợ, YT Nợ, Tiền hàng VAT] Index: [] Mình ko cop thiếu gì đâu bạn. Ouput minh cop chi để moij người biết infor ma mình muốn xuất ra thui nên mình ko cop hết ouput

Avatar Ngoc N Tran @ngoctnq
thg 10 22, 2019 9:33 SA

@MAINT nếu vậy có thể là data của bạn hàng nào cũng có N/A? bạn có thể kiểm tra 5 dòng đầu với a.head() xem data ra sao.

thg 10 22, 2019 10:02 SA

ok thanks b nhé. mà mình hỏi chút sao mình dùng pandas để pivot mà số liệu sum toàn bị lệch.ko biêt pandas có tin tưởng được ko nhỉ hoang mang quá

Avatar Ngoc N Tran @ngoctnq
thg 10 22, 2019 12:34 CH

@MAINT mình khá chắc là pandas không có lỗi gì dâu vì ai làm data science cũng dùng nó :-j bạn thử tạo ra một bảng chơi để test xem sao?

Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí