sql >> Databáze >  >> NoSQL >> MongoDB

Jak odstraním prázdné tweety pomocí filter() v pyspark?

Pokud jsou vaše data takto

tweets = sc.parallelize(["title1", "", "title2", "title3", ""])

můžete použít len(x) jako podmínka filtru:

tweets.filter(lambda x: len(x) > 0).count()



  1. MongoDB vs. DynamoDB:Co potřebujete vědět

  2. Draft.js – Nelze získat data z databáze. Chyba křížového původu

  3. Jak určit únik paměti Redis?

  4. Mongo db - Dotazování vnořeného pole a objektů