JAVA 去掉重复的数据

2023-02-22 22:17:01Python010

JAVA 去掉重复的数据,第1张

无非就是检查是否已经有数据的问题，用List做可能比较简单点

public class SigleList{

List<Integer> nums

public SingleList(){

nums = new ArrayList<Integer>()

}

public void add(Integer num){

if(!checkNumExist){

nums.add(num)

}

public boolean checkNumExist(Integer){

return nums.contains(Integer)

}

这个SingleList就简单实现了去重增加，可以用它来读数据

public class Test{

public static void main(String[] args){

SingleList nums = new SingleList()

// 产生100个数据

for(int i = 0 i++ i < 100){

// 产生随机数

Integer num = new Random().nextInt(100000)

nums.add(num)

}

foreach(Integer num : nums){

System.out.println(num)

}

这题考的是大数据去重，数据量大于内存，即无法直接在内存中去重，那么有两个方案：

1、内存外去重

也就是将数据存入数据库，然后利用数据库进行排序并去重。

优缺点：

1）优点：简单直接

2）缺点：消耗大

2、算法去重

题目中说明是20G数据，假设每行数据是1k，则数据行数是20M（如果每行数据是512字节，则数据行数是40M），可使用MD5对每行数据进行映射，获得16字节映射吗，即总共需要内存空间320M（或640M），满足内存内去重的需求。

优缺点：

1）优点：在内存内进行处理，速度明显比内存为要快。

2）缺点：需要进行额外的编码，程序复杂度和效率要求较高。

List<String> list = new ArrayList<>()

/*list.add("abc")

list.add("abc")

list.add("def")

list.add("bcd")*/

Set<String> set = new LinkedHashSet<>()//这种方式保证去重后的元素相对位置不变

//Set<String> set = new HashSet<>()//这种方式去重后元素的位置很有可能变化了

set.addAll(list)

list.clear()

list.addAll(set)

for(String s : list){

System.out.println(s)

}

整个思路就是利用set中的元素是不重复的，来达到去重的目的

数据内存元素优缺点字节

# 上一篇：sony笔记本bios恢复出厂设置

# 下一篇：这个外国人是谁？？？？求大神介绍一下

给您推荐相同类型的内容：

java中如何定义数组元素赋值为-1
java中定义数组元素赋值为-1方法：1、写一个方法传入数组长度，在定义数组的时候你用长度定义一个数组。2、定义一个一维数组，并给每个元素赋值为数组下标的值。public class TempArray {public static vo
计算机名是什么
计算机名：用户登陆时候用的是操作系统的个人用户帐号主机名就是计算机的名字（计算机名），网上邻居就是根据主机名来识别的，这个名字可以随时更改，从我的电脑属性的计算机名就可更改。用户登陆时候用的是操作系统的个人用户帐号，这个也可以更改，从控
goget请求可以接受结构体么
goget请求可以接受结构体。接收者是结构体时，可以是结构体类型、结构体指针类型。调用时不区分调用者是结构体还是结构体指针，go语言会自动转化为对应的结构体或结构体指针。上面是从源码复制得出。 Form属性包含了post表单和url后面
c语言的”或“符号
分别是 &amp&amp和||c语言中提供了三种逻辑运算符：&amp&amp（与运算）||（或运算）!（非运算）与运算符(&amp&amp)和或运算符(||)均为双目运算符。具有左结合性。非运
如何用Python编写一个聊天室
python聊天室(python2.7版本)：暂时先给出两种版本的,tcp+udp都是分别运行server.py和client.py，就可以进行通讯了。别外还有websocket版本，这个是有web界面的和基本web服务的，如果需要的
如何用iPhone网络共享给台式电脑，让电脑上网？
步骤如下：1、首先我们进入iPhone的“设置”内，就可以看到个人热点这个功能（首次使用没找到个人热点时，点开设置里的“蜂窝移动网络”，在里面找到“个人热点”打开，下次即可在设置里直接进入）。2、进入“个人热点”,先设置你的Wifi密码（
java中如何定义数组元素赋值为-1
java中定义数组元素赋值为-1方法：1、写一个方法传入数组长度，在定义数组的时候你用长度定义一个数组。2、定义一个一维数组，并给每个元素赋值为数组下标的值。public class TempArray {public static vo
请问.net是一种编程语言吗?
.NET不是一种语言，是微软开发的一种框架，为了方便理解，可以当成微软版的Java虚拟机，不过.NET框架要远比Java虚拟机强大。.NET是框架，和java、C、C#这类编程语言不是一个维度的事物，无法比较，也就谈不上区别。.NET框架
golang channel 超时如何处理
个人理解的channel超时处理思路分享，若有错误或者不足，请联系我:qq 869329877 主程序通过go timeout(）挂起一个协程，在timeout方法里面利用select来监控逻辑处理的变化，如果请求时间过长或者连接到其他
怎么关闭点击鼠标时电脑发出的声音？
第一步x0dx0a点击 -&gt开始start -&gt控制面板Control Panel, 在弹出的菜单中点击 -&gt声音和音频设备Sound &ampvoice devicesx0dx0a
Python 占位符格式化详解
占位符，顾名思义就是插在输出里站位的符号。占位符是绝大部分编程语言都存在的语法，而且大部分都是相通的，它是一种非常常用的字符串格式化的方式。常用占位符的含义 s : 获取传入对象的 str 方法的返回值，并将其格式
统计学基础知识之数据离散程度描述
离散程度指标的种类很多，下面介绍的是常用的几种。全距(Range)又称极差，是指数据中最大值和最小值的差值。如果用R表示全距，用Xmax，Xmin，分别表示数据的最大值、最小值，则全距公式为：R = Xmax- Xmin。例如，前
r语言P=p%*%p是什么意思
％＊％表示通常意义下的两个矩阵的乘积。而矩阵乘积只有在第一个矩阵的列数（column）和第二个矩阵的行数（row）相同时才有意义。x＋y加法x－y减法x＊y乘法x／y除法x＾y乘幂x％％y模运算x％／％y整数除法x＝＝y判断是否相等x &a
讲讲go语言的结构体
作为C语言家族的一员，go和c一样也支持结构体。可以类比于java的一个POJO。在学习定义结构体之前，先学习下定义一个新类型。新类型 T1 是基于 Go 原生类型 int 定义的新自定义类型，而新类型 T2 则是基于
1.14版本defer性能大幅度提升，内部实现了开放编码优化
GO中的defer会在当前函数返回前执行传入的函数，常用于关闭文件描述符，关闭链接及解锁等操作。 Go语言中使用defer时会遇到两个常见问题：接下来我们来详细处理这两个问题。官方有段对defer的解释：这里我们先来一
ruby文件夹操作
一、新建文件 f=File.new(File.join("C:","Test.txt"), "w+") f.puts("I am Jack") f.
Ruby中如何定义变量之间的引用关系？
int jimmy声明一个int类型变量 string rubystring类型变量 jimmy = Console.Read()接受输入的字符，转为int类型返回给jimmy Console.Write(jimmy)输出j
电脑上的COM接口是链接什么的？
COM口( cluster communication port )即串行通讯端口，简称串口。微机上的串口通常是9针，也有25针的接口，最大速率115200bps。通常用于连接鼠标（串口）及通讯设备（如连接外置式调制解调器进行数据通讯或一
电脑怎么启用u盘启动？
1、将制作好的U教授启动U盘插入电脑USB接口，开机或重新启动，按下对应的启动热键，比如F12；2、在弹出的启动项界面，按↑↓方向键选择U盘选项，一般为带USB Flash、USB Storage、USB HDD的选项，按Enter键进入；
拨号上网原理
拨号上网是只要用户拥有一台个人电脑、一个外置或内置的调制解调器(Modem)和一根电话线，再向本地ISP供应商申请自己的账号，或购买上网卡，拥有自己的用户名和密码后，然后通过拨打ISP的接入号连接到Internet上。ADSL技术能利用现有
github是什么
github是一个面向开源及私有软件项目的托管平台，因为只支持Git 作为唯一的版本库格式进行托管，故名gitHub。GitHub于2008年4月10日正式上线，除了git代码仓库托管及基本的Web管理界面以外，还提供了订阅、讨论组、文本
java HelloWorld中H和W为什么一定要大写
java 是运行java程序的意思，你可以在你的java安装路径中找到java.exe这个文件，你编写的程序在编译后就是能java.exe这个文件运行的，但是你要运行你写的程序就要找到那个文件，如果你的程序文件名与你java 后写的名不一样
电脑游戏用英语怎么说电脑游戏的英语是什么
1、电脑游戏的英语是：computer games，英 [kəmˈpjuːtə(r) ɡeɪmz] 美 [kəmˈpjuːtər ɡeɪmz]。2、电脑游戏市场已达到饱和。The market for computer games ha
python画词云图体现哪方面的计算思维
您好，Python画词云图体现的是计算机程序的思维。词云图是一种可视化技术，可以将文本数据可视化，从而更容易理解和探索。Python可以通过词云图来表示文本数据，从而更好地理解和探索文本数据。Python的词云图可以帮助计算机程序员更好地理
平板电脑下降怎么打出来
我猜你想问的是“平板电脑怎么打出下降这个符号”打开软键盘,右击,点特殊符号,K键就是下降符。就平板电脑来说，最常见的操作系统是Windows操作系统、Android操作系统和iOS操作系统，还有像Windows CE操作系统，另外Meego
数据的统计描述（计量资料）
1. 算数平均数（arithmetic mean） R语言函数：mean( )2.中位数（median）将所有观测值从小到大排列，居于中间位置的观测值称为中位数，用表示。当观测值为奇数个时，中位数是第位置的观测
java属于什么语言？
JAVA语言，就是属于混合型语言，这是属于解释型语言和编译型语言之间的一种语言。学习一门高级程序语言，很多人都推荐JAVA。JAVA能让你学习到一门高级程序语言的方方面面，但又不会造成学习曲线过于陡峭x0dx0ax0dx0aJava
电脑怎么能打出泰语
สวัสดีครับ กระผมมาช่วยแนะนำวิธีทำ 你首先要安装泰语舒服法。。如果你的电脑是XP的就好办多了，现在市面上的5元10元随便买一盘来，然后就可以安了。先把碟装进去，然后步骤是我的电脑---控制面板--区域和语
python怎么输入中文
解决中文输入的两种应用：在脚本中加语言编码声明 “-*- coding: uft-8 -*-”python学习网，大量的免费python视频教程，欢迎在线学习！应用一：print中出现中文方法一：用unicode(' &#
求C语言编写的表白程序，要代码
#define IdYes 1002#define IdNo 1003#define IdStatic 1004#define IdTimer 1005#define Width 640#define Height 480#define T

推荐阅读

热门文章

最新发布

标签列表

JAVA 去掉重复的数据

给您推荐相同类型的内容：