我试图列出整数列表中的重复元素,例如
List<Integer> numbers = Arrays.asList(new Integer[]{1,2,1,3,4,4});
使用jdk 8的流。有人尝试过吗?要删除重复项,我们可以使用distinct()api。但是,找到重复的元素呢?有人可以帮我吗?
我试图列出整数列表中的重复元素,例如
List<Integer> numbers = Arrays.asList(new Integer[]{1,2,1,3,4,4});
使用jdk 8的流。有人尝试过吗?要删除重复项,我们可以使用distinct()api。但是,找到重复的元素呢?有人可以帮我吗?
Answers:
您可以使用Collections.frequency
:
numbers.stream().filter(i -> Collections.frequency(numbers, i) >1)
.collect(Collectors.toSet()).forEach(System.out::println);
基本示例。前半部分构建频率图,后半部分将其缩减为过滤列表。可能不如Dave的答案有效,但功能更多(例如,如果您想准确检测两个,等等)
List<Integer> duplicates = IntStream.of( 1, 2, 3, 2, 1, 2, 3, 4, 2, 2, 2 )
.boxed()
.collect( Collectors.groupingBy( Function.identity(), Collectors.counting() ) )
.entrySet()
.stream()
.filter( p -> p.getValue() > 1 )
.map( Map.Entry::getKey )
.collect( Collectors.toList() );
您需要一个集合(allItems
下面)来保存整个数组的内容,但这是O(n):
Integer[] numbers = new Integer[] { 1, 2, 1, 3, 4, 4 };
Set<Integer> allItems = new HashSet<>();
Set<Integer> duplicates = Arrays.stream(numbers)
.filter(n -> !allItems.add(n)) //Set.add() returns false if the item was already in the set.
.collect(Collectors.toSet());
System.out.println(duplicates); // [1, 4]
filter()
需要一个无状态谓词。您的“解决方案”是惊人地相似,在javadoc中给出一个状态谓词的例子:docs.oracle.com/javase/8/docs/api/java/util/stream/...
sequential()
,这可能是安全的。在更一般的情况下,流可能是parallel()
,因此可以保证以奇怪的方式中断流。
O(n)的方式如下:
List<Integer> numbers = Arrays.asList(1, 2, 1, 3, 4, 4);
Set<Integer> duplicatedNumbersRemovedSet = new HashSet<>();
Set<Integer> duplicatedNumbersSet = numbers.stream().filter(n -> !duplicatedNumbersRemovedSet.add(n)).collect(Collectors.toSet());
这种方法会使空间复杂度提高一倍,但是空间并不是浪费。实际上,我们现在仅将重复项作为一个Set以及将所有重复项都删除的另一个Set。
我的StreamEx库增强了Java 8流,它提供了一种特殊的操作distinct(atLeast)
,该操作只能保留至少出现指定次数的元素。这样可以解决您的问题:
List<Integer> repeatingNumbers = StreamEx.of(numbers).distinct(2).toList();
在内部,它类似于@Dave解决方案,它对对象进行计数,以支持其他所需数量,并且它是并行友好的(ConcurrentHashMap
用于并行化流,但HashMap
用于顺序化)。对于大量数据,您可以使用提高速度.parallel().distinct(2)
。
你可以像这样得到重复的:
List<Integer> numbers = Arrays.asList(1, 2, 1, 3, 4, 4);
Set<Integer> duplicated = numbers
.stream()
.filter(n -> numbers
.stream()
.filter(x -> x == n)
.count() > 1)
.collect(Collectors.toSet());
numbers = Arrays.asList(400, 400, 500, 500);
stream
内部组件stream
的成本很高。
创建额外的地图或数据流既费时又费空间。
Set<Integer> duplicates = numbers.stream().collect( Collectors.collectingAndThen(
Collectors.groupingBy( Function.identity(), Collectors.counting() ),
map -> {
map.values().removeIf( cnt -> cnt < 2 );
return( map.keySet() );
} ) ); // [1, 4]
…对于这个问题,它被认为是 [重复]
public static int[] getDuplicatesStreamsToArray( int[] input ) {
return( IntStream.of( input ).boxed().collect( Collectors.collectingAndThen(
Collectors.groupingBy( Function.identity(), Collectors.counting() ),
map -> {
map.values().removeIf( cnt -> cnt < 2 );
return( map.keySet() );
} ) ).stream().mapToInt( i -> i ).toArray() );
}
我认为我有一个很好的解决方案,可以解决类似问题-List =>通过Something.a和Something.b分组的列表。有扩展的定义:
public class Test {
public static void test() {
class A {
private int a;
private int b;
private float c;
private float d;
public A(int a, int b, float c, float d) {
this.a = a;
this.b = b;
this.c = c;
this.d = d;
}
}
List<A> list1 = new ArrayList<A>();
list1.addAll(Arrays.asList(new A(1, 2, 3, 4),
new A(2, 3, 4, 5),
new A(1, 2, 3, 4),
new A(2, 3, 4, 5),
new A(1, 2, 3, 4)));
Map<Integer, A> map = list1.stream()
.collect(HashMap::new, (m, v) -> m.put(
Objects.hash(v.a, v.b, v.c, v.d), v),
HashMap::putAll);
list1.clear();
list1.addAll(map.values());
System.out.println(list1);
}
}
A类,list1只是传入数据-魔术在Objects.hash(...):)中
Objects.hash
为(v.a_1, v.b_1, v.c_1, v.d_1)
和产生相同的值(v.a_2, v.b_2, v.c_2, v.d_2)
,则它们将被视为相等并作为重复项删除,而无需实际检查a,b,c和d是否相同。这可能是可以接受的风险,或者您可能希望使用除Objects.hash
保证可以在整个域中产生唯一结果之外的其他功能。
您是否必须使用Java 8习语(蒸汽)?可以认为,一种简单的解决方案是将复杂度移至类似于地图的数据结构,该结构将数字作为键(不重复)并将其出现的时间作为值。您可以让他们迭代该映射仅对出现的数字> 1做某事。
import java.lang.Math;
import java.util.Arrays;
import java.util.List;
import java.util.Map;
import java.util.HashMap;
import java.util.Iterator;
public class RemoveDuplicates
{
public static void main(String[] args)
{
List<Integer> numbers = Arrays.asList(new Integer[]{1,2,1,3,4,4});
Map<Integer,Integer> countByNumber = new HashMap<Integer,Integer>();
for(Integer n:numbers)
{
Integer count = countByNumber.get(n);
if (count != null) {
countByNumber.put(n,count + 1);
} else {
countByNumber.put(n,1);
}
}
System.out.println(countByNumber);
Iterator it = countByNumber.entrySet().iterator();
while (it.hasNext()) {
Map.Entry pair = (Map.Entry)it.next();
System.out.println(pair.getKey() + " = " + pair.getValue());
}
}
}
试试这个解决方案:
public class Anagramm {
public static boolean isAnagramLetters(String word, String anagramm) {
if (anagramm.isEmpty()) {
return false;
}
Map<Character, Integer> mapExistString = CharCountMap(word);
Map<Character, Integer> mapCheckString = CharCountMap(anagramm);
return enoughLetters(mapExistString, mapCheckString);
}
private static Map<Character, Integer> CharCountMap(String chars) {
HashMap<Character, Integer> charCountMap = new HashMap<Character, Integer>();
for (char c : chars.toCharArray()) {
if (charCountMap.containsKey(c)) {
charCountMap.put(c, charCountMap.get(c) + 1);
} else {
charCountMap.put(c, 1);
}
}
return charCountMap;
}
static boolean enoughLetters(Map<Character, Integer> mapExistString, Map<Character,Integer> mapCheckString) {
for( Entry<Character, Integer> e : mapCheckString.entrySet() ) {
Character letter = e.getKey();
Integer available = mapExistString.get(letter);
if (available == null || e.getValue() > available) return false;
}
return true;
}
}
索引检查呢?
numbers.stream()
.filter(integer -> numbers.indexOf(integer) != numbers.lastIndexOf(integer))
.collect(Collectors.toSet())
.forEach(System.out::println);