最新发布

# 2023-02-09
鸿蒙HarmonyOS系统用户已突破3000万，跻身第三大操作系统？
华为HarmonyOS操作系统用户已经突破3000万，计划2021年底突破三亿台设备北京时间7 月 8 日，华为官方透露，华为 Harmony OS 2.0 用户已经达到 3000 万。新系统发布仅一个多月，相当于每天有一百
# 2023-02-09
harmonyos2.0.0系统好用吗
harmonyos2.0.0系统好用。对于HarmonyOS 2.0系统，最大的感受就是流畅。此前有很多用户担心从EMUI系统过渡到鸿蒙系统会不适应，其实HarmonyOS 2.0系统真的会让用户用了以后爱不释手。不管是服务卡片还是动画过
# 2023-02-09
创维电视能不能升级鸿蒙系统
创维电视不能升级鸿蒙系统目前只有华为智慧屏和荣耀智慧屏搭载了鸿蒙系统，而鸿蒙系统刚刚正式发布，创维还没有正式加入鸿蒙阵营，短期内不会为创维电视适配鸿蒙系统，所以目前创维电视是无法升级鸿蒙系统的。由于鸿蒙系统是完全开源的系统，基于安卓系统的智
# 2023-02-09
鸿蒙抄袭安卓？看这一篇就够了
01什么是 AOSP ？很多人都说鸿蒙是 AOSP 套壳，那么我们首先得明白什么是 AOSP？ AOSP 是"Android Open Source Project&
# 2023-02-09
华为harmonyos是什么手机
华为harmonyos是华为手机的操作系统，简称为鸿蒙系统。华为鸿蒙系统（HUAWEI Harmony OS），是华为公司在2019年8月9日于东莞举行华为开发者大会（HDC.2019）上正式发布的操作系统。华为鸿蒙系统是一款全新的面向全
# 2023-02-09
harmonyos是什么系统
华为harmonyos是鸿蒙系统。鸿蒙系统一款全新的面向全场景的分布式操作系统，创造一个超级虚拟终端互联的世界，将人、设备、场景有机地联系在一起，将消费者在全场景生活中接触的多种智能终端实现极速发现、极速连接、硬件互助、资源共享，用合适的设
# 2023-02-09
harmonyos是什么意思
harmonyos即鸿蒙系统的意思，正确写法为harmony os。harmony os鸿蒙系统是华为公司在2019年8月9日于东莞举行华为开发者大会（HDC.2019）上正式发布的操作系统。鸿蒙系统面向全场景的分布式操作，将人、设备、
# 2023-02-09
harmonyos是什么
harmonyos是华为鸿蒙系统。鸿蒙OS是华为公司开发的一款基于微内核、耗时10年、4000多名研发人员投入开发、面向5G物联网、面向全场景的分布式操作系统。鸿蒙的英文名是HarmonyOS，意为和谐。不是安卓系统的分支或修改而来的。与
# 2023-02-09
harmonyos可以玩原神吗
harmonyos可以玩原神。根据天眼查显示，HarmonyOS2系列，现已推送到多款机型中将正在游玩的《原神》一键从Mate40Pro转到MatePad上。《原神》是由上海米哈游制作发行的一款开放世界冒险游戏。华为于7月12日宣布，H
# 2023-02-09
magicos和鸿蒙os区别
magicos和鸿蒙os区别：两者定位不同，技术架构不同。两者定位不同：HarmonyOS旨在替换安卓、最终实现跨平台多设备分布式操作。MagicOS则是在安卓系统、Windows系统以及其它操作系统上叠加荣耀的核心能力，从而让不同生态实

如何使用python 连接kafka 并获取数据

2023-02-24 23:18:02Python017

如何使用python 连接kafka 并获取数据,第1张

连接

kafka

的库有两种类型，一种是直接连接

kafka

的，存储

offset

的事情要自己在客户端完成。还有一种是先连接

zookeeper

然后再通过

zookeeper

获取

kafka

的

brokers

offset

存放在

zookeeper

上面，由

zookeeper

来协调。

我现在使用

samsa

这个

highlevel

库

Producer示例

from

kazoo.client

import

KazooClientfrom

samsa.cluster

import

Clusterzookeeper

=

KazooClient()zookeeper.start()cluster

=

Cluster(zookeeper)topic

=

cluster.topics['topicname']topic.publish('msg')

**

Consumer示例

**

from

kazoo.client

import

KazooClientfrom

samsa.cluster

import

Clusterzookeeper

=

KazooClient()zookeeper.start()cluster

=

Cluster(zookeeper)topic

=

cluster.topics['topicname']consumer

=

topic.subscribe('groupname')for

msg

in

consumer:

print

msg

Tip

consumer

必需在

producer

向

kafka

的

topic

里面提交数据后才能连接，否则会出错。

在

Kafka

中一个

consumer

需要指定

groupname

，

groue

中保存着

offset

等信息，新开启一个

group

会从

offset

0

的位置重新开始获取日志。

kafka

的配置参数中有个

partition

，默认是

1

，这个会对数据进行分区，如果多个

consumer

想连接同个

group

就必需要增加

partition

,

partition

只能大于

consumer

的数量，否则多出来的

consumer

将无法获取到数据。

# -*- coding: utf8 -*-

# __author__ = '小红帽'

# Date: 2020-05-11

"""Naval Fate.

Usage:

py_kafka_protobuf_consume.py --bootstrap-servers=<host:port,host2:port2..>--groupId=<groupId>--topic=<topic_name>--es-servers=<host:port>--index=<schema>--type=<doc>--id=<order_id>

py_kafka_protobuf_consume.py -h | --help

py_kafka_protobuf_consume.py --version

Options:

-h --help 打印帮助信息.

--bootstrap_servers=<host:port,host2:port2..> kafka servers

--groupId=<groupId> kafka消费组

--topic=<topic_name> topic名称

--es-servers=<host:port> ES 地址

--index=<index_name> ES 索引

--type=<doc>ES type

--id=<order_id>指定id主键，快速更新

"""

import json

from kafka import KafkaConsumer

from docopt import docopt

from elasticsearch import Elasticsearch

from elasticsearch import helpers

class Kafka_consumer():

def __init__(self,args):

self.topic = args['--topic']

self.bootstrapServers = args['--bootstrap-servers']

self.groupId = args['--groupId']

self.id = args['--id']

self.es_host = args['--es-servers'].split(':')[0]

self.es_port = args['--es-servers'].split(':')[1]

self.es_index = args['--index']

self.es_type = args['--type']

self.consumer = KafkaConsumer(

bootstrap_servers=self.bootstrapServers,

group_id=self.groupId,

enable_auto_commit = True,

auto_commit_interval_ms=5000,

consumer_timeout_ms=5000

)

def consume_data_es(self):

while True:

try:

es = Elasticsearch([{'host': self.es_host, 'port': self.es_port}], timeout=3600)

self.consumer.subscribe([self.topic])

actions=[]

for message in self.consumer:

if message is not None:

query = json.loads(message.value)['data'][0]

action = {

"_index": self.es_index,

"_type": self.es_type,

"_id": json.loads(message.value)['data'][0][self.id],

"_source": query

}

actions.append(action)

if len(actions) >50:

helpers.bulk(client=es, actions=actions)

print("插入es %s 条数据" % len(actions))

actions = []

if len(actions) >0:

helpers.bulk(client=es, actions=actions)

print("等待超时时间，插入es %s 条数据" % len(actions))

actions=[]

except BaseException as e:

print(e)

if __name__ == '__main__':

arguments = docopt(__doc__,version='sbin 1.0')

consumer = Kafka_consumer(arguments)

consumer.consume_data_es()

数据示例信息放在有个

# 上一篇：微积分很多函数后面要乘个dt，究竟是什么意思啊？

# 下一篇：r语言读取csv文件为什么报错